tri-tue-nhan-tao-voi-nhieu-ky-nang

Các nhà khoa học trí tuệ nhân tạo đã phát hiện ra các phương pháp giúp máy móc có thể nhìn, nghe, nói và viết.

Cho đến nay, chúng ta đã thấy Trí tuệ nhân tạo làm được điều kỳ diệu theo nhiều cách. Một vài lĩnh vực như Y tế, quốc phòng, giáo dục, du lịch và du lịch – bạn đặt tên cho nó và những tiến bộ do Trí tuệ nhân tạo mang lại sẽ khiến bạn vấp ngã. Mỗi ngày trôi qua, các nhà nghiên cứu đang cố gắng bằng mọi cách có thể để trang bị cho máy móc nhiều kỹ năng hơn nữa để máy móc có tiềm năng mang lại kết quả được cải thiện với độ chính xác và độ chính xác cao hơn nữa.

Các nhà khoa học Trí tuệ nhân tạo đã đi trước một bước trong thế giới được thúc đẩy bởi công nghệ này bằng cách khám phá các phương pháp cho phép máy móc không chỉ nhìn (như được phát triển ban đầu) mà còn nghe, nói và viết.

Trí tuệ nhân tạo với nhiều kỹ năng trông như thế nào?

Ít nhiều đã xảy ra trường hợp trong đó các chương trình Trí tuệ nhân tạo được xây dựng với động cơ để phục vụ cho việc thực hiện một hoạt động tại một thời điểm. Hãy xem xét ví dụ về ma-nơ-canh. Một hình nộm được cung cấp bởi NLP có tiềm năng sử dụng các cụm từ. Nếu có một tính năng bổ sung được tích hợp, các nhà nghiên cứu lo ngại rằng mục đích ban đầu có thể không được đáp ứng.

Tuy nhiên, một ví dụ khác là thuật toán nhận dạng âm thanh và thị giác máy tính xách tay, rõ ràng là phục vụ cho việc nhận dạng tầm nhìn và giọng nói. Ngược lại, họ không thể dùng ngôn ngữ để giải thích chúng.

Đã qua rồi cái thời mà người ta tin rằng mục đích duy nhất của việc triển khai Trí tuệ nhân tạo sẽ mất đi nếu có nhiều lĩnh vực cần giải quyết. Hôm nay, tình hình dường như đã xoay chuyển 360 độ. Các nhà nghiên cứu hy vọng rằng khi các mô hình được xây dựng với nhiều lĩnh vực để phục vụ, điều đó có thể tạo ra một hệ thống AI tiên tiến và mạnh mẽ có đủ khả năng xử lý các vấn đề với độ chính xác cao nhất. Với điều này, máy móc có thể được sử dụng ở mức tốt nhất có thể để đối phó với các tình huống, bất kể chúng phức tạp đến mức nào.

Trở lại vào tháng 9, các nhà nghiên cứu của Viện Allen về Trí tuệ Tổng hợp, AI2, đã đưa ra tiêu đề. Họ đã nghĩ ra một hình nộm có thể tạo ra hình ảnh từ chú thích văn bản. Tất cả điều này làm sáng tỏ khả năng mà thuật toán có khi nói đến các cụm từ liên kết với dữ liệu hiển thị. Cùng quan điểm đó, các nhà nghiên cứu của Đại học Bắc Carolina, Chapel Hill, đã nỗ lực hết sức để phát triển một phương pháp kết hợp hình ảnh vào các mô hình ngôn ngữ hiện có.

Với sự tiến bộ trong công nghệ, các thuật toán phục vụ cho rất nhiều lĩnh vực. GPT-3 của OpenAI không cần đề cập đặc biệt về khía cạnh này. Tên như vậy là do OpenAI đã sử dụng các khái niệm này để tăng GPT-3. Tái tạo thao tác ngôn ngữ kết hợp với khả năng cảm nhận sẽ mang lại kết quả hiệu quả – đây là điều mà các nhà khoa học dự đoán. Hiện tại – bước đầu tiên đã được thực hiện. Kết quả được cung cấp là thời trang hai phương thức dễ dàng hoặc Trí tuệ nhân tạo bằng ngôn ngữ hình ảnh.

Chỉ vài tháng trở lại đây, phòng thí nghiệm đã cho ra mắt hai thời trang ngôn ngữ hình ảnh. Một người tập trung vào việc siêu liên kết các đối tượng trong ảnh với các cụm từ mô tả chúng trong chú thích. Cái còn lại tạo ra những bức ảnh chủ yếu dựa trên sự kết hợp của những ý tưởng mà nó đã khám phá ra.

Hiện chúng ta đang ở giai đoạn mà các chương trình đa phương thức có thể tạo ra các trợ lý robot nâng cao hơn. Với các mô hình này, có thể điều hướng, làm việc, hoàn thành nhiệm vụ bất chấp những hạn chế, v.v. Tuy nhiên, các nhà nghiên cứu không sẵn sàng dừng lại ở đây. Một ví dụ như vậy là phòng thí nghiệm AI2.

Phòng thí nghiệm này đang làm việc để thêm ngôn ngữ và kết hợp các đầu vào cảm giác bổ sung, như âm thanh và nhiều thứ khác vào máy móc để chúng cũng có thể thực hiện các tác vụ phức tạp.

Trong tương lai, điều quan trọng là các chương trình đa phương thức phải có vị trí để khắc phục ít nhất một vài hạn chế lớn nhất của AI. Làm việc trong khía cạnh làm cho Trí tuệ nhân tạo trở nên an toàn hơn và dễ sử dụng hơn rất nhiều nên được coi trọng. Tóm lại, các chương trình đa phương thức có thể trở thành những AI chính mà chúng ta có thể dựa vào mà không nghi ngờ gì.

Nguồn: analyticsinsight