FPT và Nvidia phát hành tập dữ liệu tiếng Việt với 900.000 'hồ sơ nhân vật'

📌 Diğer 📰 VnExpress (VN) 🕐 3 saat önce

Tập dữ liệu Nemotron-Personas-Vietnam, do FPT và Nvidia phát triển, nằm trong top 10 tập dữ liệu thịnh hành trên Hugging Face sau 5 ngày phát hành.

Tập đoàn FPT vừa phối hợp cùng Nvidia để giới thiệu bộ dữ liệu chuyên biệt mang tên Nemotron-Personas-Vietnam. Sản phẩm này bao gồm 900.000 hồ sơ nhân vật được thiết kế riêng cho ngôn ngữ tiếng Việt, nhằm hỗ trợ quá trình huấn luyện và phát triển các mô hình trí tuệ nhân tạo. Ngay sau khi công bố trên nền tảng Hugging Face, bộ dữ liệu đã nhanh chóng thu hút sự quan tâm lớn từ cộng đồng công nghệ toàn cầu. Chỉ trong vòng chưa đầy một tuần, dự án này đã lọt vào danh sách 10 tập dữ liệu phổ biến nhất trên trang web này. Đây được xem là một bước tiến quan trọng trong việc nâng cao khả năng xử lý ngôn ngữ tự nhiên cho các ứng dụng AI tại Việt Nam.

Sự hợp tác này giúp thu hẹp khoảng cách về tài nguyên dữ liệu tiếng Việt, tạo tiền đề cho việc phát triển các mô hình AI bản địa chất lượng cao và hiệu quả hơn.

📌 Kaynak

Bu özet VnExpress (VN) kaynağından otomatik derlenmiştir. Tamamı için orijinal habere gidin.

Orijinal haberi oku →

📱

News AI World — Mobil uygulama

Bu haberleri 45 dilde, anlık çeviriyle cebinde. Erken erişim için Gmail adresini bırak.

← Tüm haberlere dön

FPT và Nvidia phát hành tập dữ liệu tiếng Việt với 900.000 'hồ sơ nhân vật'

📌 Kaynak

📰 Önerilen haberler