Công nghệ

Nghiên cứu cho thấy AI là con dao hai lưỡi đối với thông tin y khoa

My An • 14/10/2024 - 18:33

Bạn có biết - nếu hỏi AI về các vấn đề tim mạch bằng tiếng Việt, bạn có thể nhận được lời khuyên về bệnh Parkinson? Đây là một trong những phát hiện bất ngờ từ công trình khoa học do các nghiên cứu viên Đại học RMIT Việt Nam dẫn đầu, mới được công bố trên Tạp chí Y khoa Anh quốc (BMJ).

Nghiên cứu “Thông tin sức khỏe cho mọi người: Các mô hình ngôn ngữ lớn đang thu hẹp hay nới rộng khoảng cách số?” hướng sự chú ý đến một vấn đề nổi trội trong tương lai ứng dụng AI của ngành y tế. Mặc dù các mô hình ngôn ngữ lớn (Large Language Models - LLM) như ChatGPT hứa hẹn cho phép truy cập thông tin sức khỏe 24/7, nhóm nghiên cứu phát hiện ra rằng các mô hình này có thể đưa ra thông tin không chính xác hoặc gây hiểu lầm khi dùng ngôn ngữ có nguồn tài nguyên kỹ thuật số hạn chế.

Theo Statista, hơn 80% toàn bộ nội dung trên mạng được viết bằng tám ngôn ngữ chính. Tuy nhiên, tám ngôn ngữ này lại chỉ đại diện cho 21% dân số thế giới, đồng nghĩa với việc phần lớn dân số toàn cầu có thể phải nhận thông tin sai lệch do AI tạo ra.

Tiến sĩ Arthur Tang, tác giả chính của nghiên cứu đến từ Đại học RMIT Việt Nam, cho biết: "Chúng tôi nhận thấy rằng LLM hiệu quả với những ngôn ngữ có nhiều tài nguyên như tiếng Anh, nhưng lại thường gặp khó khăn về độ chính xác ngôn ngữ và tính xác thực thông tin khi dùng các ngôn ngữ có ít tài nguyên như tiếng Việt. Những khu vực sử dụng ngôn ngữ có ít tài nguyên cũng thường có điều kiện kinh tế khó khăn hơn. Điều đó có nghĩa là trạng thái hiện tại của những tiến bộ công nghệ như LLM có thể khiến chênh lệch về mặt xã hội và kinh tế sâu sắc hơn".

hinh-1(1).jpg — Mô hình ngôn ngữ lớn có thể cung cấp thông tin không chính xác hoặc gây hiểu lầm khi dùng những ngôn ngữ có nguồn tài nguyên số hạn chế. (Hình: Pexels)

Nghiên cứu trên là kết quả hợp tác quốc tế giữa các nghiên cứu viên đến từ Đại học RMIT Việt Nam, Đơn vị nghiên cứu lâm sàng Đại học Oxford (OUCRU), Đại học Trung văn Hồng Kông, Đại học Quốc gia Singapore và Đại học Melbourne. Đáng chú ý là nghiên cứu còn có sự tham gia của hai sinh viên theo học chương trình cử nhân ở RMIT Việt Nam (hiện đã tốt nghiệp) với tư cách đồng tác giả.

Các sinh viên đã nhận được hỗ trợ kỹ thuật và các nguồn lực điện toán thiết yếu từ trung tâm RMIT RACE Hub. RMIT RACE Hub cũng nâng cao trải nghiệm học tập của sinh viên bằng cách cho họ tiếp cận các thiết bị nghiên cứu tiên tiến.

Nguyễn Quỳnh Giang, sinh viên mới tốt nghiệp ngành Cử nhân Công nghệ thông tin cho biết: "Quá trình thực hiện nghiên cứu đã cho tôi mở rộng tầm mắt về những tác động thực tế của AI trong lĩnh vực y tế. Lý tưởng nhất là AI sẽ đem đến quyền tiếp cận các dịch vụ và thông tin y tế một cách bình đẳng, nhưng hiện vẫn còn một số rào cản cho đến khi chúng ta đạt đến độ trưởng thành công nghệ như vậy".

Bùi Minh Nhật, đã hoàn tất bằng Kỹ sư (Kỹ thuật Phần mềm) tại RMIT Việt Nam và hiện đang học Thạc sĩ Trí tuệ nhân tạo tại Đại học RMIT ở Melbourne, chia sẻ về ý nghĩa thực tiễn của công trình: "Nghiên cứu của chúng tôi cho thấy việc đơn giản như hỏi về các triệu chứng bệnh tim bằng tiếng Việt có thể cho đáp án là thông tin về một căn bệnh không liên quan như Parkinson. Điều này phản ánh yêu cầu cấp thiết phải phát triển các hệ thống AI bao trùm hơn, phục vụ cho mọi ngôn ngữ và nền văn hóa".

Nhóm nghiên cứu nhấn mạnh rằng giải quyết vấn đề này đòi hỏi sáng kiến đa ngành từ các nhà hoạch định chính sách, các đơn vị tài trợ nghiên cứu, các công ty công nghệ lớn, cộng đồng nghiên cứu, các chuyên gia y tế và những cộng đồng có sự hiện diện thấp về mặt ngôn ngữ.

Các đơn vị tài trợ đóng vai trò then chốt trong việc mở rộng hỗ trợ cho tính bao trùm về ngôn ngữ AI. Một ví dụ là chương trình Grand Challenges 2023 (Thử thách lớn 2023) của Quỹ Bill & Melinda Gates. Chương trình này đã tài trợ cho các dự án phát triển toàn cầu nhằm góp phần vào quyền tiếp cận AI công bằng.

Các tập đoàn công nghệ lớn cũng đóng vai trò quan trọng. Ví dụ, dự án No Language Left Behind (Không ngôn ngữ nào bị bỏ lại phía sau) của Meta hướng tới nâng cao khả năng dịch nhiều ngôn ngữ khác nhau cho AI.

Nghiên cứu của Tiến sĩ Arthur Tang và đồng nghiệp cũng nêu rõ rằng cộng đồng nghiên cứu nên dẫn dắt các sáng kiến về dữ liệu ngôn ngữ cũng như các mô hình và công cụ nguồn mở, vốn rất cần thiết cho đào tạo và nghiên cứu LLM.

Tiến sĩ Tang chia sẻ: “Tại RMIT, chúng tôi tham gia sâu vào nhiều dự án ứng dụng LLM trong các cơ sở y tế. Nỗ lực của chúng tôi không chỉ tập trung vào việc vượt qua thách thức về công nghệ mà còn hướng tới nâng cao tính bao trùm của công nghệ này đối với tiếng Việt. Mục đích là đảm bảo rằng mọi người dân Việt Nam đều có cơ hội hưởng lợi từ những tiến bộ công nghệ gần đây”.

Tiến sĩ Tang đặc biệt tự hào về sự tham gia của các sinh viên vào công trình nghiên cứu và tiết lộ rằng dự án này bắt nguồn từ một dự án cuối khóa thuộc bậc đại học vào năm ngoái.

“Tạp chí Y khoa Anh quốc là một trong những tạp chí lâu đời và uy tín nhất trong ngành y đa khoa. Tỉ lệ chấp nhận đăng bài của tạp chí này chỉ khoảng 7% tính trên 7.000-8.000 bài nộp mỗi năm. Vì vậy, đây thực sự là một thành tựu xuất sắc đối với các đồng tác giả là sinh viên”, ông cho biết.

"Sinh viên RMIT trau dồi kinh nghiệm thực tế với những công nghệ AI đang định hình lại các ngành nghề trên toàn thế giới. Điều này giúp các bạn chuẩn bị để trở thành những người dẫn đầu trong việc áp dụng AI một cách có đạo đức và hiệu quả trong sự nghiệp tương lai”.

Dự án nghiên cứu trên có sự tham gia của các nghiên cứu viên đến từ Khoa Khoa học, Kỹ thuật và Công nghệ, Đại học RMIT Việt Nam, gồm Tiến sĩ Stanley Lương, Thạc sĩ Tom Huỳnh và Phó giáo sư Đinh Ngọc Minh. Dự án được tài trợ bởi Quỹ đổi mới chiến lược thuộc RMIT Việt Nam, với sự hỗ trợ và nguồn lực điện toán từ RMIT AWS Cloud Supercomputing (Trung tâm RACE Hub).

My An