Thông báo
Hello, world! This is a toast message.

XÂY DỰNG CHATBOT HỎI ĐÁP VỀ DỮ LIỆU ĐA DẠNG SINH HỌC SỬ DỤNG KỸ THUẬT RETRIEVAL-AUGMENTED GENERATION VÀ GOOGLE GEMINI: NGHIÊN CỨU TRƯỜNG HỢP HỒ AYUN HẠ, TỈNH GIA LAI

https://doi.org/10.64302/joshusc.v33n2.1361

Hoàng Đình Trung, Nguyễn Dũng, Nguyễn Ngọc Thuỷ

Email: nguyendung@hueuni.edu.vn

Tập 33, Số 2
Thời gian xuất bản: 3/2026
Mục lục: mucluc.pdf
Tóm tắt

Bài báo trình bày nghiên cứu xây dựng hệ thống chatbot thông minh phục vụ tra cứu thông tin đa dạng sinh học ở tỉnh Gia Lai và trong nghiên cứu này lấy hồ Ayun Hạ, tỉnh Gia Lai làm ví dụ, dựa trên kỹ thuật Retrieval-Augmented Generation (RAG) kết hợp mô hình ngôn ngữ lớn Gemini của Google. Dữ liệu thực nghiệm là bộ danh lục 73 loài côn trùng nước thuộc 7 bộ, thu thập tại 9 điểm khảo sát trên hồ Ayun Hạ trong giai đoạn 2020-2022, được số hóa sang định dạng JSON với đầy đủ thông tin phân loại học, đặc điểm sinh thái và phân bố theo điểm. Hệ thống sử dụng mô hình nhúng text-embedding-004 của Google, kho vector FAISS và khung ứng dụng LangChain để xây dựng quy trình truy xuất và sinh câu trả lời. Thực nghiệm cho thấy hệ thống đạt hiệu quả cao, giảm thiểu đáng kể hiện tượng áo giác so với mô hình ngôn ngữ lớn không tích hợp RAG, đồng thời cung cấp câu trả lời có trích dẫn nguồn cụ thể, đáp ứng yêu cầu tra cứu chuyên ngành. Nghiên cứu là bước thử nghiệm thí điểm mở đường cho việc mở rộng hệ thống sang các nhóm sinh vật và hệ sinh thái trên cạn, thủy vực khác tại tỉnh Gia Lai.

Từ khóa
Retrieval-Augmented Generation, Chatbot, Đa dạng sinh học, Google Gemini
File tóm tắt: Chưa tải lên
File toàn văn: