OpenAI giới thiệu DALL-E 3, cho phép các nghệ sĩ từ chối tham gia đào tạo

Trí tuệ nhân tạo đã có những tiến bộ đáng kể trong việc biến mô tả văn bản thành các loại tác phẩm nghệ thuật khác nhau, từ chân dung sống động đến các kiểu tưởng tượng. Tuy nhiên, việc tạo ra câu hỏi hoàn hảo vẫn đang đối mặt với khá nhiều khó khăn, thậm chí đã phát triển thành một lĩnh vực chuyên môn được gọi là "kỹ thuật gợi ý."

DALL-E 3, với việc tích hợp ChatGPT, mang lại một giải pháp. Các người đăng ký gói ChatGPT cao cấp của OpenAI, bao gồm ChatGPT Plus và ChatGPT Enterprise, hiện có thể nhập các yêu cầu về hình ảnh của họ và điều chỉnh chúng thông qua cuộc trò chuyện tương tác với chatbot. Kết quả được gửi đến một cách trôi chảy trong ứng dụng trò chát.

ChatGPT cải thiện các yêu cầu gợi ý, ngay cả những yêu cầu chỉ gồm vài từ, bằng cách làm cho chúng trở nên mô tả hơn, qua đó đưa ra hướng dẫn rõ ràng hơn đối với mô hình DALL-E 3.

DALL-E 3 không chỉ dừng lại ở việc tích hợp ChatGPT; nó còn giới thiệu những cải tiến về chất lượng hình ảnh. Cải tiến này đặc biệt rõ rệt khi xử lý các yêu cầu gợi ý dài hơn. Ngoài ra, nó còn giải quyết các thách thức lịch sử mà các mô hình tạo hình ảnh gặp phải, như vấn đề về văn bản và mô tả các bàn tay con người.

Hơn nữa, DALL-E 3 tích hợp các cơ chế mới được thiết kế để giảm thiểu sự thiên vị thuật toán và tăng cường tính an toàn. Ví dụ, nó sẽ từ chối các yêu cầu yêu cầu hình ảnh theo phong cách của các nghệ sĩ đương thời hoặc có sự xuất hiện của nhân vật nổi tiếng. Trong một sự phát triển quan trọng, nghệ sĩ hiện có khả năng chọn không để sử dụng tác phẩm nghệ thuật của họ để đào tạo các phiên bản tương lai của các mô hình tạo hình ảnh từ văn bản của OpenAI. Thay đổi này đến khi OpenAI, cùng với một số đối thủ, đang phải đối mặt với cuộc kiểm tra pháp lý về việc sử dụng tác phẩm bản quyền trong việc đào tạo các mô hình tạo hình ảnh trí tuệ nhân tạo.

Sự ra mắt của DALL-E 3 diễn ra trong bối cảnh cạnh tranh gia tăng trong lĩnh vực trí tuệ nhân tạo tạo hình ảnh, đặc biệt là trong việc tổng hợp hình ảnh. Các đối thủ như Midjourney và Stability AI liên tục hoàn thiện các mô hình tạo hình ảnh của họ, tăng áp lực lên OpenAI để duy trì vị trí hàng đầu.

OpenAI dự định giới thiệu DALL-E 3 cho người dùng gói ChatGPT cao cấp vào tháng 10, và sau đó sẽ có sẵn cho các phòng thí nghiệm nghiên cứu và khách hàng API. Công ty chưa tiết lộ liệu họ có hoặc khi nào sẽ phát hành phiên bản trực tuyến miễn phí, tương tự như các phiên bản trước đây của DALL-E (DALL-E 2 và phiên bản gốc của DALL-E).