Trí tuệ nhân tạo sinh sôi (Generative AI) là gì?
Bước đột phá của Generative AI là nó có thể tạo ra dữ liệu gốc tương tự từ dữ liệu hiện có (hình ảnh, tệp âm thanh, văn bản), chẳng hạn như Deepfake, thường tạo ra nhiều trường hợp sử dụng tiêu cực khác nhau, cũng thuộc về AI sinh học.
Có một số mô hình của Generative AI, phổ biến nhất là Generative Adversarial Network (GAN) có thể được học mà không cần giám sát. Hai mạng nơ-ron cạnh tranh với nhau, và một mạng hoạt động như một "máy phát điện" - tạo ra Dữ liệu nhân tạo, một mạng đóng vai trò "người phân biệt" - liên tục cố gắng phân biệt giữa dữ liệu thực và dữ liệu thô. Sau mỗi lần kiểm tra, bộ tạo điều chỉnh các thông số để tạo ra dữ liệu thuyết phục hơn, cho đến khi bộ phân biệt không thể phân biệt giữa đúng và sai sau nhiều lần lặp lại.
Do đó, GAN có thể tạo ra các tác phẩm mới đáng tin cậy theo phong cách của một bản gốc, thay vì bản sao của một bức tranh. Dự án Động vật biết, do Viện Công nghệ Massachusetts (MIT) khởi xướng, đã tạo ra những hình ảnh chân thực về động vật lai, chứng minh khả năng tạo dữ liệu mới từ đầu, được gọi là "dữ liệu tổng hợp". Hiệu suất của các thuật toán học máy thường liên quan đến lượng dữ liệu. Trong một số trường hợp dữ liệu khan hiếm, việc sử dụng dữ liệu tổng hợp có thể làm tăng lượng dữ liệu trong tập huấn luyện (được gọi là tăng dữ liệu) hoặc thay đổi nó.
What is Generative Artificial Intelligence ?
The breakthrough of Generative AI is that it can generate similar original data from existing data (images, audio files, text), such as Deepfake, which often produces various negative use cases, also belongs to generative AI.
There are several models of Generative AI, the most popular being the Generative Adversarial Network (GAN) that can be learned unsupervised. Two neural networks compete with each other, and one acts as a "generator" - generating artificial Data, one does the "discriminator" - constantly trying to distinguish between real data and raw data. After each test, the generator adjusts parameters to create more convincing data, until the discriminator cannot distinguish between true and false after repeated iterations.
As a result, GANs can create believable new works in the style of an original, rather than a photocopy of a painting. The Knowing Animals project, launched by the Massachusetts Institute of Technology (MIT), created photorealistic images of hybrid animals, demonstrating this ability to create new data from scratch, known as "synthetic data." The performance of machine learning algorithms is often related to the amount of data. In some cases where data is scarce, using synthetic data can increase the amount of data in the training set (called data augmentation) or change it.