Để “huấn luyện” GPT, các nhà khoa học của OpenAI đã thu thập một lượng lớn văn bản chữ viết, từ các nguồn hiện có, nhất là trên không gian mạng, cũng như các nguồn thông tin công khai khác, với khối lượng khổng lồ. Tiếp đó, họ tiến hành “làm sạch” và lựa chọn nội dung trước khi đưa cho mô hình AI đọc và huấn luyện nhiều lần; từ đó mô hình AI sẽ tìm hiểu được các tầng ý nghĩa đằng sau những từ và câu (nôm na là nó có thể hiểu được cả nghĩa hiển ngôn lẫn hàm ngôn), và càng đọc nhiều lần thì sẽ càng nâng cao được tầng ý nghĩa của nó. Hẳn nhiên, với nguồn tài nguyên đồ sộ như thế cùng khả năng tổng hợp cực nhanh, ChatGPT có thể vượt qua tất cả các bộ óc con người dù thông minh, hiểu biết nhất trong việc trả lời một số câu hỏi mà nó có đủ dữ kiện.
Chính vì vậy, ChatGPT được xem như một trong những mô hình ngôn ngữ tiên tiến nhất hiện nay với khả năng tự động học và làm việc với các loại dữ liệu lớn, đương nhiên phải là những kiến thức mang tính phổ biến chứ không phải mọi kiến thức, mọi vấn đề mang tính riêng biệt, đặc thù hoặc hạn chế người biết (nhất là khi hỏi bằng tiếng địa phương, từ lóng…). Nó được trang bị với các tính năng nổi bật như tự động hóa cuộc trò chuyện, trả lời câu hỏi, tạo ra các câu trả lời tự động và cải thiện khả năng tự học của mô hình, tức là nó học và nạp dữ liệu từ chính các câu hỏi của người dùng.
Theo nhiều người, điểm yếu lớn nhất của ChatGPT là dữ liệu của chatbot này chỉ được cập nhật đến hết năm 2021. Tức là nhiều thông tin sau thời gian này hiện chưa được cập nhật.
ChatGPT hiện thu hút hàng triệu người dùng toàn cầu. Ảnh: SHUTTERSTOCK
Bên cạnh đó, một số ưu điểm của ChatGPT có thể, như nhân cách hóa cuộc trò chuyện (về hình thức là tạo ra cuộc trò chuyện giữa người và người, điều khác hơn nhiều so với việc bạn nhập tìm kiếm trên Google); cung cấp câu trả lời chuyên sâu và theo cách dễ hiểu theo dạng hỏi đáp; đưa ra các gợi ý, đề xuất; sáng tạo nội dung (hỗ trợ tìm kiếm nguồn cảm hứng hoặc ý tưởng mới cho các hoạt động sáng tạo); hỗ trợ học ngoại ngữ thông qua vào cuộc trò chuyện bằng ngôn ngữ mà người dùng lựa chọn, cung cấp các bài học ngữ pháp, từ vựng, đưa ra phản hồi và chỉnh sửa… Ngoài ra, ChatGPT có thể hỗ trợ dịch thuật, đưa ra các chẩn đoán y tế, sử dụng cho mục đích giải trí…
Trên thực tế, có một số vấn đề ChatGPT có gợi ý rất tốt cho người dùng. Chẳng hạn, khi đặt câu hỏi về phát triển thể thao học đường, công cụ này gợi ý một số giải pháp khá thuyết phục như: xây dựng các cơ sở vật chất tốt, tạo điều kiện cho học sinh tham gia các hoạt động thể thao, đào tạo đội ngũ huấn luyện viên chuyên nghiệp, tăng cường hợp tác với các câu lạc bộ thể thao địa phương, khuyến khích học sinh tham gia vào các loại hình thể thao khác nhau, tạo ra môi trường yêu thích thể thao...
Tuy nhiên, cho đến thời điểm hiện tại, có lẽ chúng ta đừng trông đợi quá nhiều ở ChatGPT và cũng đừng lệ thuộc nó, bởi kiến thức ChatGPT cung cấp có khá nhiều điều thiếu chính xác, không đáng tin cậy hoặc không thể đưa ra được câu trả lời. Thí dụ, khi yêu cầu ChatGPT tìm thông tin về một nhân vật không quá nổi tiếng, Google sẽ cho ra hàng loạt trang có cái tên đó, nhưng ChatGPT lại trả lời: “Xin lỗi, tôi không thể xác định chính xác Nguyễn Văn A. mà bạn đang hỏi về. "Nguyễn Văn A." là một cái tên phổ biến ở Việt Nam và có thể là của nhiều người khác nhau. Nếu bạn cung cấp thêm thông tin cụ thể về Nguyễn Văn A. mà bạn muốn tìm hiểu, tôi sẽ cố gắng trợ giúp bạn tốt hơn”.
Còn trong trường hợp khác, nếu người dùng không có đủ kiến thức sẽ bị ChatGPT cung cấp thông tin sai lệch, từ đó ảnh hưởng nghiêm trọng đến hiểu biết và nhận thức của người dùng. Thí dụ, khi yêu cầu ChatGPT “viết tin về trận đội tuyển Việt Nam thắng đội tuyển Singapore 3-1”, nó đã tường thuật ngắn về trận đấu này cứ như là một trận đấu có thật nhưng trên thực tế chưa từng có trận đấu nào giữa hai đội tuyển mà có tỷ số đó. ChatGPT đã có nhiều nhận định “y như thật”, chẳng hạn với các cách diễn đạt: “diễn ra vào chiều nay”, “màn trình diễn ấn tượng”, “được đông đảo khán giả đến xem”, “các cầu thủ Việt Nam đã chơi rất tập trung và thi đấu hăng say”… “Bản tin” này cho biết trong trận đấu này, Công Phượng đã lập cú đúp và bàn còn lại của Quang Hải, một điều mà trên thực tế chưa từng xảy ra trong bất kỳ một trận đấu nào của đội tuyển Việt Nam!
Tương tự, việc lấy “râu ông nọ cắm cằm bà kia” trong các câu trả lời của ChatGPT cũng khá phổ biến. Chẳng hạn, nêu tên một số cuốn sách ở Việt Nam, công cụ này dường như rất “hâm mộ” nhà văn Nguyễn Nhật Ánh khi thường xuyên đưa tên tác giả Mắt biếc vào các tác phẩm khác. Như trong trường hợp sau đây, sự nhầm lẫn không chỉ tai hại ở tên nhà văn mà còn một số yếu tố khác: "Rồi ai sẽ kể? là một tiểu thuyết đậm chất lịch sử của nhà văn Nguyễn Nhật Ánh. Cuốn sách này kể về câu chuyện của một anh chàng trẻ tuổi tên là Quân, người đã tình cờ phát hiện ra một cuốn nhật ký của một người lính Việt Nam Cộng hòa đã hy sinh (sic) trong chiến tranh Việt Nam”. Trên thực tế, Rồi ai sẽ kể? là một tạp văn của tác giả Nguyễn Minh Hải, không phải một tiểu thuyết và không liên quan gì đến nhà văn Nguyễn Nhật Ánh. Điều đáng nói là ChatGPT đã “nâng” câu chuyện thành “nhật ký của một người lính Việt Nam Cộng hòa đã hy sinh”, cứ như là cách diễn đạt của người ở chế độ Sài Gòn trước năm 1975!
Còn về “tài năng” sáng tác thơ, sự thật hẳn sẽ làm nhiều người thất vọng. Cái gọi là “thơ” của ChatGPT thậm chí còn không thể gọi là “văn vần” được, vì các câu (dù thường được xếp thành các khổ có 4 câu) không có vần điệu, không có ý và tứ thơ, không thể hiện được tính nghệ thuật… Các câu tuy có nghĩa nhưng không thể nào sắp xếp lại thành một bài thơ vì mang ý nghĩa rời rạc, đơn điệu…, và có những diễn đạt rất ngô nghê. Không ít trường hợp “thơ” còn sai cả kiến thức cơ bản. Chẳng hạn, khi yêu cầu ChatGPT làm một bài thơ về cô gái Bến Tre, nó đã viết: “Miền quê Bến Tre thật tuyệt vời và đáng yêu/ Bên sông Vàm Cỏ Đông thơm ngát trái cây”, trong khi Bến Tre cách sông Vàm Cỏ Đông một khoảng cách không hề nhỏ! Hay thơ về Thạnh Phú thì lại: “Ngày mai về cõi quê hương cũ/ Thạnh Phú nắng ấm, gió mát trên đồi”, trong khi Thạnh Phú là một huyện miền biển của tỉnh Bến Tre không hề có núi đồi…
Chưa nói đến những điều mang tính sáng tạo, tính cảm xúc hay việc sử dụng chữ nghĩa lắt léo, ngay cả nhiều kiến thức cơ bản thì ChatGPT vẫn để lại cho người sử dụng một sự ngờ vực lớn về tính chính xác. Do đó, người dùng ChatGPT phải thực sự cẩn thận, phải có kiến thức nhất định để có thể nhận ra điều nó cung cấp có đúng không và đúng đến mức độ nào. Còn tin tưởng tuyệt đó ChatGPT thì thực sự phải… bán lúa giống