Zalo đạt giải nhất cuộc thi trí tuệ nhân tạo về xử lý ngôn ngữ tự nhiên và tiếng nói
Tại cuộc thi VLSP (Vietnamese Language and Speech Processing) lần thứ 6 năm 2019 do Viện Hàn lâm Khoa học và Công nghệ cùng Trường ĐH Khoa học tự nhiên (ĐHQG HN) tổ chức, Zalo đạt giải nhất về Tổng hợp tiếng nói và giải nhì Nhận dạng tiếng nói.
Xử lý tiếng nói tiếng Việt là bài toán khó trong nghiên cứu và phát triển AI tại Việt Nam. Trong nhiều năm qua, bài toán này được đưa vào đề thi của VLSP nhằm kết nối các nhóm chuyên gia của doanh nghiệp, trường đại học và viện nghiên cứu, chia sẻ kinh nghiệm và tìm ra giải pháp tốt nhất trong lĩnh vực xử lý ngôn ngữ tự nhiên và giọng nói tiếng Việt.
VLSP 2019 được phát động từ đầu tháng 9, có 4 hạng mục: Hate Speech Detection on Social Networks (Nhận diện các nội dụng tiêu cực, độc hại trên mạng xã hội), Vietnamese dependency parsing (Phân tích cấu trúc tiếng Việt); Automatic Speech Recognition (Nhận dạng tiếng nói); Text To Speech (Tổng hợp tiếng nói).

Nhấn để phóng to ảnh
Về đề thi Text to Speech, tập dữ liệu huấn luyện gồm 15.000 đoạn ghi âm giọng miền Nam (tổng thời gian 23 giờ) và gần 1000 đoạn ghi âm giọng miền Bắc (tổng thời gian 45 phút). Sau đó, ban tổ chức gửi cho các đội thi 60 câu văn bản cho mỗi giọng; mô hình AI của các đội thi phải sinh ra file âm thanh những câu đó. Kết quả này được gửi ngẫu nhiên cho 24 người, những người này sẽ chấm điểm dựa trên chất lượng giọng nói và mức độ tự nhiên của file âm thanh.
Điểm khó nhất của đề thi này là là dữ liệu đầu vào khá nhiễu, các đội thi cần lọc sạch dữ liệu để training tốt nhất cho mô hình AI. Tuy nhiên, thời gian xử lý dữ liệu chỉ có 2 tuần khiến cho nhiều đội thi gặp trở ngại. “Team Zalo đã sáng tạo ra giải pháp chuẩn hóa dữ liệu ban đầu hoàn toàn tự động, đây cũng là điểm nổi trội hơn so với các đội thi khác” - ông Nguyễn Quốc Bảo, Lead Scientist của Zalo chia sẻ.

Nhấn để phóng to ảnh
Ngoài ra, vốn là đơn vị đang tập trung đầu tư nghiên cứu mảng xử lý tiếng nói tiếng Việt, Zalo có thế mạnh về công nghệ và con người. Đơn vị này đang ứng dụng các công nghệ mới nhất hiện nay về xử lý ngôn ngữ tự nhiên và tiếng nói, cùng với đội ngũ kỹ sư AI nhiều kinh nghiệm, team Zalo đã vượt qua nhiều đối thủ đáng gờm, đạt giải nhất với số điểm 3.94/5 hạng mục Text To Speech.
Xử lý tiếng nói tiếng Việt được nghiên cứu ở Việt Nam từ lâu nhưng áp dụng thì chỉ mới bước đầu. Ông Nguyễn Quốc Bảo cho rằng, dữ liệu huấn luyện phải từ 2000 giờ trở lên và đảm bảo đa dạng giọng, vùng miền và cách nói thì mô hình AI - Nhận dạng tiếng nói mới có khả năng áp dụng thực tế tốt. Với những đơn vị đầu tư quyết liệt vào AI như Zalo, cơ hội tiệm cận với các tập đoàn công nghệ hàng đầu thế giới là rất lớn.
Cũng trong sự kiện VLSP 2019, Zalo đạt giải nhì hạng mục Automatic Speech Recognition (Nhận diện tiếng nói).
Theo Dân trí
Bài viết cùng chuyên mục
Đọc thêm

Xu hướng tìm kiếm quý II/2025 trên Cốc Cốc
Công ty TNHH Công nghệ Cốc Cốc vừa phát hành Báo cáo xu hướng tìm kiếm quý II/2025, đề cập mối quan tâm của người dùng Việt Nam trên không gian mạng.

Ứng dụng khoa học kỹ thuật, nâng cao giá trị cây trồng
Ứng dụng khoa học - kỹ thuật được xem là một đòi hỏi để nâng cao năng suất, chất lượng, giá trị cây trồng. Chính vì thế, những năm qua, các chủ trang trại, gia trại trên địa bàn tỉnh Thanh Hóa đã đầu tư máy móc, ứng dụng công nghệ vào sản xuất để nâng cao chất lượng, số lượng sản phẩm, đáp ứng nhu cầu của thị trường.

Khoảng 100 chuyên gia đầu ngành sẽ tham gia các chương trình, nhiệm vụ trọng điểm cấp quốc gia về AI
Theo Bộ Khoa học và Công nghệ, có khoảng 100 chuyên gia đầu ngành trong và ngoài nước sẽ tham gia các chương trình, nhiệm vụ trọng điểm cấp quốc gia về AI. Đây là bước đi chiến lược nhằm cụ thể hóa mục tiêu đưa trí tuệ nhân tạo trở thành động lực cốt lõi cho tăng trưởng kinh tế, hiện đại hóa đất nước và nâng cao năng lực cạnh tranh quốc gia.

Cảnh báo mưa rào và dông khu vực tỉnh Thanh Hoá chiều tối 09/7
Theo Đài Khí tượng thủy văn tỉnh Thanh Hoá cánh báo có mưa rào và dông khu vực tỉnh Thanh Hoá chiều tối 09/7. Trong cơn dông có khả năng xảy ra lốc, sét, mưa đá và gió giật mạnh.

Ra mắt 3 nền tảng số phục vụ triển khai Nghị quyết số 57
Ban Chỉ đạo Trung ương về phát triển khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số vừa ra mắt 3 nền tảng số phục vụ triển khai Nghị quyết số 57.

Bán thuốc trực tuyến bắt buộc công khai chứng chỉ hành nghề và số điện thoại người tư vấn
Nghị định 163/2025 của Chính phủ yêu cầu bắt buộc các cơ sở kinh doanh dược khi hoạt động trên các ứng dụng hoặc sàn giao dịch thương mại điện tử phải công khai đầy đủ các thông tin pháp lý liên quan.

Trước 1/1/2026, sổ bảo hiểm điện tử sẽ tích hợp trên VNeID
Sổ bảo hiểm xã hội điện tử sẽ chính thức được tích hợp trên ứng dụng định danh điện tử quốc gia VNeID và dự kiến hoàn thành chậm nhất vào ngày 1/1/2026. Đây là bước tiến quan trọng trong công cuộc chuyển đổi số quốc gia, mang lại những giá trị thiết thực và tiện ích vượt trội cho người dân trong việc tiếp cận và quản lý các quyền lợi về an sinh xã hội.

Thanh Hóa đẩy mạnh phát triển hạ tầng thanh toán số
Trong những năm qua, tỉnh Thanh Hóa đã tích cực đẩy mạnh phát triển hạ tầng thanh toán số, làm cơ sở để thúc đẩy thanh toán không dùng tiền mặt, đáp ứng nhu cầu thanh toán nhanh chóng, thuận tiện của người dân.

Cảnh báo mã độc nhắm đến hàng trăm ứng dụng ngân hàng trên toàn cầu
Các chuyên gia đã phát hiện một loại mã độc nhắm đến nền tảng Android, mang tên gọi “Godfather”, có khả năng tạo ra một môi trường ảo cách ly trên các thiết bị di động để đánh cắp thông tin đăng nhập tài khoản, chiếm quyền kiểm soát các ứng dụng ngân hàng, tài chính trên thiết bị.

Ứng dụng công nghệ sinh học, phát triển nông nghiệp an toàn
Nhằm mang lại hiệu quả kinh tế, hạn chế ô nhiễm môi trường, ngành nông nghiệp Thanh Hóa đang tích cực ứng dụng công nghệ sinh học tạo ra những sản phẩm cây trồng, vật nuôi đạt năng suất, sản lượng cao và an toàn thực phẩm.
Bình luận
Thông báo
Bạn đã gửi thành công.