FPT và Nvidia phát hành tập dữ liệu tiếng Việt với 900.000 'hồ sơ nhân vật'
Tập dữ liệu Nemotron-Personas-Vietnam, do FPT và Nvidia phát triển, nằm trong top 10 tập dữ liệu thịnh hành trên Hugging Face sau 5 ngày phát hành.
Tập đoàn FPT vừa phối hợp cùng Nvidia để giới thiệu bộ dữ liệu chuyên biệt mang tên Nemotron-Personas-Vietnam. Sản phẩm này bao gồm 900.000 hồ sơ nhân vật được thiết kế riêng cho ngôn ngữ tiếng Việt, nhằm hỗ trợ quá trình huấn luyện và phát triển các mô hình trí tuệ nhân tạo. Ngay sau khi công bố trên nền tảng Hugging Face, bộ dữ liệu đã nhanh chóng thu hút sự quan tâm lớn từ cộng đồng công nghệ toàn cầu. Chỉ trong vòng chưa đầy một tuần, dự án này đã lọt vào danh sách 10 tập dữ liệu phổ biến nhất trên trang web này. Đây được xem là một bước tiến quan trọng trong việc nâng cao khả năng xử lý ngôn ngữ tự nhiên cho các ứng dụng AI tại Việt Nam.
Sự hợp tác này giúp thu hẹp khoảng cách về tài nguyên dữ liệu tiếng Việt, tạo tiền đề cho việc phát triển các mô hình AI bản địa chất lượng cao và hiệu quả hơn.
📌 Kaynak
Bu özet VnExpress (VN) kaynağından otomatik derlenmiştir. Tamamı için orijinal habere gidin.
Orijinal haberi oku →