Dịch bởi: Quỳnh Hương
Trí tuệ nhân tạo tạo sinh (Generative AI) mô tả các thuật toán (ví dụ như ChatGPT) có thể được sử dụng để tạo nội dung mới, bao gồm âm thanh, mã, hình ảnh, văn bản, mô phỏng và video. Những đột phá mới gần đây trong lĩnh vực này có khả năng thay đổi mạnh mẽ cách chúng ta tiếp cận việc tạo nội dung.
Các hệ thống AI tạo sinh thuộc danh mục máy học rộng lớn và đây là cách một hệ thống như ChatGPT tự mô tả những gì nó có thể làm:
Bạn đã sẵn sàng nâng sự sáng tạo của mình lên một tầm cao mới chưa? Không cần tìm đâu xa ngoài các AI tạo sinh! Hình thức máy học tiện lợi này cho phép máy tính tạo ra tất cả các loại nội dung mới và thú vị, từ âm nhạc và nghệ thuật đến toàn bộ thế giới ảo. Và nó không chỉ để giải trí—AI tạo sinh còn có rất nhiều ứng dụng thực tế, như tạo ra các thiết kế sản phẩm mới và tối ưu hóa các quy trình kinh doanh. Vậy tại sao phải chờ đợi? Giải phóng sức mạnh của trí tuệ nhân tạo AI và xem bạn có thể tạo ra những sáng tạo tuyệt vời nào!
Có điều gì sai đối với bạn trong đoạn trên không? Có thể là không. Ngữ pháp hoàn hảo, văn phong khá ổn và mạch truyện cũng trôi chảy.
CHATGPT VÀ DALL-E LÀ GÌ?
Đó là lý do tại sao ChatGPT với GPT là từ viết tắt của Generative pre-train transformer—hiện đang nhận được rất nhiều sự chú ý. Nó là một chatbot có thể tạo ra một câu trả lời phù hợp với hầu hết câu hỏi mà nó tự đặt ra. Được phát triển bởi OpenAI, và được phát hành để test đại chúng vào tháng 11 năm 2022, nó đã được đánh giá là chatbot AI tốt nhất từ trước tới giờ. Và nó cũng phổ biến: hơn một triệu người dùng đăng ký sử dụng chỉ trong 5 ngày. Những người hâm mộ nhanh tay đã đăng các ví dụ về chatbot tạo mã máy tính, các bài tiểu luận cấp đại học, các bài thơ và thậm chí cả những câu chuyện cười nửa vời. Những người khác, trong số rất nhiều người kiếm sống bằng cách tạo nội dung, từ những người viết quảng cáo cho đến các giáo sư được thuê, đang khá run sợ.
Trong khi đang có rất nhiều phản ứng sợ hãi với ChatGPT (và AI và học máy rộng hơn), thì rõ ràng máy học rất tiềm năng. Trong những năm kể từ khi được triển khai rộng rãi, máy học đã chứng tỏ được tác động của nó trong một số ngành, hoàn thành những việc như phân tích hình ảnh y tế và dự báo thời tiết có độ phân giải cao. Một cuộc khảo sát năm 2022 của McKinsey cho thấy việc áp dụng AI đã tăng hơn gấp đôi trong 5 năm qua và đầu tư vào AI đang tăng lên nhanh chóng. Rõ ràng là các công cụ AI tạo sinh như ChatGPT và DALL-E (một công cụ dành cho nghệ thuật do AI tạo ra) có khả năng thay đổi cách thức thực hiện một loạt công việc. Tuy nhiên, ta vẫn chưa biết hết được phạm vi tác động cũng như rủi ro của các công cụ này. Nhưng có một số câu hỏi mà chúng ta có thể trả lời – chẳng hạn như cách xây dựng các mô hình AI tạo sinh, loại vấn đề nào phù hợp nhất để giải quyết và cách chúng phù hợp với danh mục máy học rộng hơn.
VẬY ĐÂU LÀ SỰ KHÁC NHAU GIỮA MACHINE LEARNING VÀ AI?
Trí tuệ nhân tạo gần giống như tên gọi của nó – đó là hoạt động khiến máy móc bắt chước trí thông minh của con người để thực hiện các nhiệm vụ. Bạn có thể đã tương tác với AI ngay cả khi bạn không nhận ra điều đó – các trợ lý giọng nói như Siri và Alexa được thành lập dựa trên công nghệ AI, cũng như các chatbot dịch vụ khách hàng bật lên để giúp bạn điều hướng các trang web.
Machine learning (máy học) là một loại trí tuệ nhân tạo. Thông qua machine learning, các chuyên gia phát triển trí tuệ nhân tạo thông qua các mô hình có thể “học” từ các mẫu dữ liệu mà không cần sự chỉ đạo của con người. Khối lượng dữ liệu khổng lồ và độ phức tạp khó quản lý (dù sao thì con người cũng không thể quản lý được) hiện đang được tạo ra đã làm tăng tiềm năng của machine learning cũng như nhu cầu về nó.
NHỮNG CHỦNG LOẠI CHÍNH CỦA MÔ HÌNH MÁY HỌC LÀ GÌ?
Machine learning được phát triển trên cơ sở một số yếu tố nền tảng, bắt đầu bằng các kỹ thuật thống kê cổ điển được phát triển từ thế kỷ 18 đến thế kỷ 20 cho các tập dữ liệu nhỏ. Trong những năm 1930 và 1940, những người tiên phong về điện toán – bao gồm cả nhà toán học lý thuyết Alan Turing – bắt đầu nghiên cứu các kỹ thuật cơ bản cho máy học. Nhưng những kỹ thuật này chỉ giới hạn trong các phòng thí nghiệm cho đến cuối những năm 1970, khi các nhà khoa học lần đầu tiên phát triển những máy tính đủ mạnh để gắn chúng.
Cho đến gần đây, học máy phần lớn chỉ giới hạn ở các mô hình dự đoán, được sử dụng để quan sát và phân loại các mẫu trong nội dung. Ví dụ: một vấn đề học máy cổ điển là bắt đầu với một hình ảnh hoặc một số hình ảnh về những chú mèo đáng yêu. Sau đó, chương trình sẽ xác định các mẫu trong số các hình ảnh, rồi xem xét kỹ lưỡng các hình ảnh ngẫu nhiên để tìm những hình phù hợp với mẫu mèo đáng yêu. AI tạo sinh là một bước đột phá. Thay vì chỉ đơn giản là nhận biết và phân loại ảnh của một con mèo, máy học giờ đây có thể tạo ra một hình ảnh hoặc văn bản mô tả về một con mèo theo yêu cầu.
MÔ HÌNH MÁY HỌC DỰA VÀO DỮ LIỆU VĂN BẢN HOẠT ĐỘNG NHƯ THẾ NÀO? CHÚNG ĐƯỢC ĐÀO TẠO RA SAO?
ChatGPT hiện có thể nhận được tất cả các tiêu đề, nhưng nó không phải là mô hình máy học dựa trên dữ liệu ngôn ngữ đầu tiên gây được tiếng vang. GPT-3 của OpenAI và BERT của Google đều đã ra mắt trong những năm gần đây với một số thành tích đáng kể. Nhưng trước ChatGPT, mà hầu hết các tài khoản đều hoạt động khá tốt trong hầu hết thời gian (mặc dù nó vẫn đang được đánh giá), các chatbot AI không phải lúc nào cũng nhận được đánh giá tốt nhất. Phóng viên công nghệ Cade Metz của New York Times cho biết trong một video mà trong đó, anh ấy và nhà văn chuyên viết về ẩm thực Priya Krishna đã yêu cầu GPT-3 viết công thức cho một bữa tối Lễ Tạ ơn (khá thảm hại).
Các mô hình máy học đầu tiên hoạt động với dữ liệu văn bản đã được con người đào tạo để phân loại các đầu vào khác nhau theo nhãn do các nhà nghiên cứu đặt. Một ví dụ sẽ là một mô hình được đào tạo để gắn hashtag các bài đăng trên mạng xã hội là tích cực hoặc tiêu cực. Kiểu đào tạo này được gọi là học có giám sát vì con người chịu trách nhiệm “dạy” mô hình phải làm gì.
Thế hệ tiếp theo của các mô hình máy học dựa trên văn bản dựa trên cái được gọi là học tự giám sát. Loại hình đào tạo này liên quan đến việc cung cấp cho mô hình một lượng lớn dữ liệu văn bản để mô hình có thể tạo dự đoán. Ví dụ, một số mô hình có thể dự đoán, dựa trên một vài từ, một câu sẽ kết thúc như thế nào. Với số lượng văn bản mẫu phù hợp – chẳng hạn như một vùng rộng lớn trên internet – các mẫu văn bản này trở nên khá chính xác. Chúng tôi đang thấy mức độ chính xác với sự thành công của các công cụ như ChatGPT.
CẦN LÀM GÌ ĐỂ XÂY DỰNG MỘT MÔ HÌNH AI TẠO SINH?
Việc xây dựng một mô hình AI tạo sinh phần lớn là một công việc quan trọng, đến mức chỉ một số đối thủ nặng ký về công nghệ có nguồn lực tốt mới thực hiện được. OpenAI, công ty đứng sau ChatGPT, các mô hình GPT trước đây và DALL-E, có hàng tỷ đô la tài trợ từ các nhà tài trợ. DeepMind là công ty con của Alphabet, công ty mẹ của Google và Meta đã phát hành sản phẩm Make-A-Video dựa trên AI tạo sinh. Các công ty này tuyển dụng một số nhà khoa học và kỹ sư máy tính giỏi nhất thế giới.
Nhưng nó không chỉ là vấn đề về tài năng. Khi bạn yêu cầu một mẫu hình đào tạo sử dụng gần như toàn bộ internet, bạn sẽ phải trả giá. OpenAI chưa công bố chi phí chính xác, nhưng các ước tính chỉ ra rằng GPT-3 đã được đào tạo trên khoảng 45 terabyte dữ liệu văn bản – tức là khoảng một triệu feet không gian giá sách hoặc một phần tư toàn bộ Thư viện Quốc hội – với chi phí ước tính là vài triệu đô la. Đây không phải là những tài nguyên mà công ty startup có thể chạm đến.
MỘT MÔ HÌNH AI TẠO SINH CÓ THỂ TẠO RA NHỮNG LOẠI ĐẦU RA NÀO?
Như bạn có thể nhận thấy ở trên, kết quả đầu ra từ các mô hình AI tạo sinh có thể không thể phân biệt được với nội dung do con người tạo ra hoặc chúng có vẻ hơi kỳ lạ. Kết quả phụ thuộc vào chất lượng của mô hình – như chúng ta đã thấy, kết quả đầu ra của ChatGPT cho đến nay có vẻ vượt trội so với kết quả của những chatbot tiền nhiệm – và sự phù hợp giữa mô hình và trường hợp sử dụng hoặc đầu vào.
ChatGPT có thể tạo ra cái mà một nhà bình luận gọi là bài luận “điểm A-” so sánh các lý thuyết về chủ nghĩa dân tộc của Benedict Anderson và Ernest Gellner – trong vòng mười giây. Nó cũng tạo ra một đoạn văn vốn đã nổi tiếng mô tả cách lấy một chiếc bánh mì kẹp bơ đậu phộng ra khỏi VCR theo phong cách của Kinh thánh King James. Các mô hình nghệ thuật do AI tạo ra như DALL-E (tên của nó là sự kết hợp giữa nghệ sĩ theo trường phái siêu thực Salvador Dalí và người máy đáng yêu của Pixar WALL-E) có thể tạo ra những hình ảnh đẹp, lạ theo yêu cầu, như bức tranh Raphael về Madonna và đứa trẻ, đang ăn pizza. Các mô hình AI tạo sinh khác có thể tạo mã lập trình, video, âm thanh hoặc mô phỏng kinh doanh.
Nhưng kết quả đầu ra không phải lúc nào cũng chính xác hay phù hợp. Khi Priya Krishna yêu cầu DALL-E 2 nghĩ ra một hình ảnh cho bữa tối Lễ tạ ơn, nó đã tạo ra một cảnh trong đó con gà tây được trang trí bằng cả quả chanh, đặt cạnh một cái bát có vẻ là guacamole. Về phần mình, ChatGPT dường như gặp khó khăn khi đếm hoặc giải các bài toán đại số cơ bản — hoặc thực tế là đang khắc phục thành kiến phân biệt giới tính và phân biệt chủng tộc đang ẩn nấp trong các dòng chảy ngầm của Internet và xã hội nói chung.
Đầu ra AI tạo sinh là sự kết hợp được hiệu chỉnh cẩn thận của dữ liệu được sử dụng để huấn luyện các thuật toán. Do lượng dữ liệu được sử dụng để huấn luyện các thuật toán này quá lớn – như đã lưu ý, GPT-3 được huấn luyện trên 45 terabyte dữ liệu văn bản – các mô hình có vẻ “sáng tạo” khi tạo kết quả đầu ra. Hơn nữa, các mô hình thường có các yếu tố ngẫu nhiên, nghĩa là chúng có thể tạo ra nhiều kết quả đầu ra khác nhau từ một yêu cầu đầu vào – làm cho chúng thậm chí trông giống như thật hơn.
MÔ HÌNH AI TẠO SINH CÓ THỂ GIẢI QUYẾT NHỮNG DẠNG VẤN ĐỀ NÀO?
Bạn có thể đã thấy rằng các công cụ AI (đồ chơi?) tổng hợp như ChatGPT có thể tạo ra hàng giờ giải trí bất tận. Cơ hội cũng rõ ràng cho các doanh nghiệp. Các công cụ AI tạo sinh có thể tạo ra nhiều loại bài viết đáng tin cậy trong vài giây, sau đó phản hồi những phản biện để làm cho bài viết phù hợp hơn với mục đích. Điều này có ý nghĩa đối với nhiều ngành công nghiệp, từ các tổ chức CNTT và phần mềm có thể hưởng lợi từ những đoạn code tức thời, phần lớn là chính xác do các mô hình AI tạo ra cho đến các tổ chức cần nội dung cho mục đích tiếp thị. Nói tóm lại, bất kỳ tổ chức nào cần sản xuất các tài liệu bằng văn bản rõ ràng đều có khả năng được hưởng lợi. Các tổ chức cũng có thể sử dụng AI tạo sinh để tạo ra nhiều tài liệu kỹ thuật hơn, chẳng hạn như các phiên bản hình ảnh y tế có độ phân giải cao hơn. Và với thời gian và nguồn lực tiết kiệm được ở đây, các tổ chức có thể theo đuổi các cơ hội kinh doanh mới và cơ hội tạo ra nhiều giá trị hơn.
Chúng tôi đã thấy rằng việc phát triển một mô hình AI tạo sinh tốn nhiều tài nguyên đến mức không thể thực hiện được đối với tất cả, trừ các công ty lớn nhất và có nguồn lực tốt nhất. Các công ty đang tìm cách đưa AI tạo sinh vào hoạt động có tùy chọn sử dụng AI tạo sinh ngay lập tức hoặc tinh chỉnh chúng để thực hiện một nhiệm vụ cụ thể. Ví dụ: nếu bạn cần chuẩn bị slide trình chiếu theo một kiểu cụ thể, bạn có thể yêu cầu mô hình “tìm hiểu” cách các tiêu đề thường được viết dựa trên dữ liệu trong các slide, sau đó cung cấp dữ liệu đầu vào ở dạng slides và yêu cầu mô hình viết các tiêu đề thích hợp.
VẬY CÓ NHỮNG HẠN CHẾ NÀO TỒN TẠI TRONG MÔ HÌNH AI? LÀM THẾ NÀO ĐỂ KHẮC PHỤC ĐƯỢC CHÚNG?
Vì chúng quá mới mẻ nên chúng tôi vẫn chưa thấy được sự ảnh hưởng lâu dài của các mô hình trí tuệ nhân tạo. Điều đó đồng nghĩa với việc sẽ có vài rủi ro cố hữu liên quan đến việc sử dụng chúng – vài rủi ro có thể biết được và một số thì không.
Các kết quả do các mô hình AI mang lại có thể khá là thuyết phục. Đây là do thiết kế. Nhưng thi thoảng những thông tin mà chúng tạo ra lại sai hoàn toàn. Tệ hơn nữa, đôi khi nó mang thành kiến (vì nó được xây dựng dựa trên giới tính, chủng tộc và vô số thành kiến khác của Internet và xã hội nói chung) và có thể bị thao túng để kích hoạt hoạt động phi đạo đức hoặc tội phạm. Ví dụ: ChatGPT sẽ không cung cấp cho bạn hướng dẫn về cách nối dây nóng cho một chiếc ô tô, nhưng nếu bạn nói rằng bạn cần nối dây nóng cho một chiếc ô tô để cứu một em bé, thì thuật toán sẽ sẵn lòng tuân thủ. Các tổ chức dựa trên các mô hình AI tạo sinh nên tính đến các rủi ro về uy tín và pháp lý liên quan đến việc vô tình xuất bản nội dung thiên vị, xúc phạm hoặc có bản quyền.
Tuy nhiên, những rủi ro này có thể được giảm thiểu bằng một số cách. Thứ nhất, điều quan trọng là phải cẩn thận trong chọn lọc dữ liệu ban đầu được sử dụng để đào tạo các mô hình này để tránh đưa vào nội dung độc hại hoặc thiên vị. Tiếp theo, thay vì sử dụng mô hình AI tạo sinh có sẵn, các tổ chức có thể cân nhắc sử dụng các mô hình chuyên biệt, nhỏ hơn. Các tổ chức có nhiều tài nguyên hơn cũng có thể tùy chỉnh một mô hình chung dựa trên dữ liệu của riêng họ để phù hợp với nhu cầu của họ và giảm thiểu sai lệch. Các tổ chức cũng nên duy trì vai trò của con người trong vòng lặp (nghĩa là để đảm bảo một người thực sự kiểm tra đầu ra của mô hình AI tạo sinh trước khi nó được xuất bản hoặc sử dụng) và tránh sử dụng các mô hình AI tạo sinh cho các quyết định quan trọng, chẳng hạn như những quyết định liên quan đến tài nguyên quan trọng hoặc phúc lợi của con người.
Chưa đủ để nhấn mạnh rằng đây là một lĩnh vực mới. Bối cảnh rủi ro và cơ hội có thể sẽ thay đổi nhanh chóng trong những tuần, tháng và năm tới. Các trường hợp sử dụng mới đang được thử nghiệm hàng tháng và các mô hình mới có thể sẽ được phát triển trong những năm tới. Khi trí tuệ nhân tạo tạo sinh ngày càng được tích hợp liền mạch, nhanh chóng vào hoạt động kinh doanh, xã hội và cuộc sống cá nhân của chúng ta, chúng ta cũng có thể mong đợi một môi trường pháp lý mới sẽ hình thành. Khi các tổ chức bắt đầu thử nghiệm – và tạo ra giá trị – với những công cụ này, các nhà lãnh đạo sẽ làm tốt việc nắm bắt nhịp đập của quy định và rủi ro.
Nguồn: McKinsey