Quá nhiều mô hình AI?

Calvin D

Hiện nay, chúng ta đang chứng kiến sự bùng nổ của các mô hình AI, với khoảng 10 mô hình mới được giới thiệu mỗi tuần. Sự xuất hiện dày đặc này khiến việc so sánh giữa chúng trở nên ngày càng khó khăn, ngay cả khi việc này chưa bao giờ dễ dàng ngay từ đầu. Nguyên nhân đằng sau sự tăng trưởng này là gì?

Danh sách các AI models trong tuần:

  • LLaMa-3: Mẫu ngôn ngữ lớn mới nhất của Meta, được gắn nhãn là "mở", mặc dù tính mở này hiện đang được tranh cãi. Nó rất phổ biến trong cộng đồng người dùng.
  • Mistral 8×22: Một mô hình lớn được biết đến với tên gọi "hỗn hợp của các chuyên gia", do một công ty Pháp sản xuất đã dần trở nên kém cởi mở hơn gần đây.
  • Stable Diffusion 3 Turbo: Phiên bản nâng cấp của SD3, từ Stability, giới thiệu API mới. Việc sử dụng "turbo" theo tên gọi của OpenAI.
  • Trợ lý AI Adobe Acrobat: Adobe giới thiệu tính năng tương tác với tài liệu, có thể là dịch vụ dựa trên ChatGPT.
  • Reka Core: Một mô hình đa phương tiện mới của một nhóm trước đây làm việc cho một công ty AI lớn, nhằm cạnh tranh với các mô hình lớn hơn.
  • Idefics2: Một mô hình đa phương tiện mở hơn, tích hợp các mô hình nhỏ hơn gần đây từ Mistral và Google.
  • OLMo-1.7-7B: Phiên bản lớn hơn của LLM của AI2, là một trong những mô hình mở nhất hiện có, chuẩn bị cho các mô hình quy mô lớn trong tương lai.
  • Pile-T5: Phiên bản cải tiến của mô hình T5, được tinh chỉnh trên cơ sở dữ liệu mã Pile.
  • Cohere Compass: Một mô hình nhúng xử lý nhiều loại dữ liệu, được thiết kế cho nhiều trường hợp sử dụng hơn.
  • Imagine Flash: Mô hình sinh ảnh mới nhất của Meta, sử dụng phương pháp mới để tăng tốc diffusion mà không làm giảm chất lượng quá nhiều.
  • Limitless: Một AI cá nhân hoá hoạt động trên các nền tảng web, macOS, Windows và thiết bị đeo, được cung cấp năng lượng bởi các tương tác của bạn.

Chúng ta đang trong một giai đoạn đặc biệt trong phát triển AI, với sự góp mặt của nhiều mô hình, từ những nhóm tạo ra nhỏ lẻ đến các đội ngũ lớn với nguồn lực dồi dào. Trong tuần này, một loạt mô hình AI mới đã được giới thiệu, mỗi cái có những đặc điểm riêng biệt: từ 'LLaMa-3', một mô hình ngôn ngữ lớn mới của Meta, đến 'Stable Diffusion 3 Turbo', một phiên bản nâng cấp của SD3, và 'Imagine Flash', mô hình tạo ảnh mới nhất của Meta, sử dụng kỹ thuật khuếch tán hiệu quả. Thêm vào đó, các công cụ phát triển và quản lý AI như torchtune và Glaze 2.0 cũng được công bố.

Tuy nhiên, không thể đánh giá từng mô hình một. Cần hiểu rằng, không phải mọi mô hình mới đều cần sự theo dõi chặt chẽ. Thay vào đó, một số AI phát triển thành các nền tảng web với nhiều ứng dụng khác nhau, trong khi những mô hình khác hỗ trợ ngầm. Sự phát triển của AI đang đa dạng giống như ngành công nghiệp ô tô, với sự lựa chọn rộng rãi mà phần lớn không ảnh hưởng trực tiếp đến người dùng. Sự nổ lực trong nghiên cứu AI vẫn tiếp tục, với những tiến bộ dần dần nhưng quan trọng cho sự tiến triển. Chúng tôi đang chuẩn bị tổng quan về các mô hình đáng chú ý, nhằm nổi bật những bước tiến cần thiết cho những ai quan tâm đến AI.