ĐÀI PHÁT THANH VÀ TRUYỀN HÌNH THANH HÓA

Thanh Hoa Radio and Television
Đường dây nóng: 0237 3721150

Zalo đạt giải nhất cuộc thi trí tuệ nhân tạo về xử lý ngôn ngữ tự nhiên và tiếng nói

Tại cuộc thi VLSP (Vietnamese Language and Speech Processing) lần thứ 6 năm 2019 do Viện Hàn lâm Khoa học và Công nghệ cùng Trường ĐH Khoa học tự nhiên (ĐHQG HN) tổ chức, Zalo đạt giải nhất về Tổng hợp tiếng nói và giải nhì Nhận dạng tiếng nói.

08/11/2019 14:34

Xử lý tiếng nói tiếng Việt là bài toán khó trong nghiên cứu và phát triển AI tại Việt Nam. Trong nhiều năm qua, bài toán này được đưa vào đề thi của VLSP nhằm kết nối các nhóm chuyên gia của doanh nghiệp, trường đại học và viện nghiên cứu, chia sẻ kinh nghiệm và tìm ra giải pháp tốt nhất trong lĩnh vực xử lý ngôn ngữ tự nhiên và giọng nói tiếng Việt.

VLSP 2019 được phát động từ đầu tháng 9, có 4 hạng mục: Hate Speech Detection on Social Networks (Nhận diện các nội dụng tiêu cực, độc hại trên mạng xã hội), Vietnamese dependency parsing (Phân tích cấu trúc tiếng Việt); Automatic Speech Recognition (Nhận dạng tiếng nói); Text To Speech (Tổng hợp tiếng nói).

 

Zalo đạt giải nhất cuộc thi trí tuệ nhân tạo về xử lý ngôn ngữ tự nhiên và  tiếng nói - 1
 

Nhấn để phóng to ảnh

Ban tổ chức và các đội dự thi tại VLSP

Về đề thi Text to Speech, tập dữ liệu huấn luyện gồm 15.000 đoạn ghi âm giọng miền Nam (tổng thời gian 23 giờ) và gần 1000 đoạn ghi âm giọng miền Bắc (tổng thời gian 45 phút). Sau đó, ban tổ chức gửi cho các đội thi 60 câu văn bản cho mỗi giọng; mô hình AI của các đội thi phải sinh ra file âm thanh những câu đó. Kết quả này được gửi ngẫu nhiên cho 24 người, những người này sẽ chấm điểm dựa trên chất lượng giọng nói và mức độ tự nhiên của file âm thanh.

Điểm khó nhất của đề thi này là là dữ liệu đầu vào khá nhiễu, các đội thi cần lọc sạch dữ liệu để training tốt nhất cho mô hình AI. Tuy nhiên, thời gian xử lý dữ liệu chỉ có 2 tuần khiến cho nhiều đội thi gặp trở ngại. “Team Zalo đã sáng tạo ra giải pháp chuẩn hóa dữ liệu ban đầu hoàn toàn tự động, đây cũng là điểm nổi trội hơn so với các đội thi khác” - ông Nguyễn Quốc Bảo, Lead Scientist của Zalo chia sẻ.

 

Zalo đạt giải nhất cuộc thi trí tuệ nhân tạo về xử lý ngôn ngữ tự nhiên và  tiếng nói - 2
 

Nhấn để phóng to ảnh

Xử lý dữ liệu đầu vào càng tốt, mô hình AI cho kết quả càng cao. (Ảnh: Extemetech)

Ngoài ra, vốn là đơn vị đang tập trung đầu tư nghiên cứu mảng xử lý tiếng nói tiếng Việt, Zalo có thế mạnh về công nghệ và con người. Đơn vị này đang ứng dụng các công nghệ mới nhất hiện nay về xử lý ngôn ngữ tự nhiên và tiếng nói, cùng với đội ngũ kỹ sư AI nhiều kinh nghiệm, team Zalo đã vượt qua nhiều đối thủ đáng gờm, đạt giải nhất với số điểm 3.94/5 hạng mục Text To Speech.

Xử lý tiếng nói tiếng Việt được nghiên cứu ở Việt Nam từ lâu nhưng áp dụng thì chỉ mới bước đầu. Ông Nguyễn Quốc Bảo cho rằng, dữ liệu huấn luyện phải từ 2000 giờ trở lên và đảm bảo đa dạng giọng, vùng miền và cách nói thì mô hình AI - Nhận dạng tiếng nói mới có khả năng áp dụng thực tế tốt. Với những đơn vị đầu tư quyết liệt vào AI như Zalo, cơ hội tiệm cận với các tập đoàn công nghệ hàng đầu thế giới là rất lớn.

Cũng trong sự kiện VLSP 2019, Zalo đạt giải nhì hạng mục Automatic Speech Recognition (Nhận diện tiếng nói).

Theo Dân trí


Ý kiến bạn đọc

Xem thêm bình luận

Đọc thêm

Ứng dụng công nghệ vi sinh trong chăn nuôi

Ứng dụng công nghệ vi sinh trong chăn nuôi

15:32 , 20/04/2024

Trước thực tế số lượng trang trại, gia trại chăn nuôi gia súc, gia cầm ngày càng tăng, ứng dụng công nghệ vi sinh vào sản xuất được xem là một trong những giải pháp tối ưu, mang lại nhiều lợi ích cho người trực tiếp sản xuất cũng như góp phần nâng cao năng suất, chất lượng sản phẩm, phòng chống dịch bệnh và bảo đảm vệ sinh môi trường chăn nuôi.

Tập trung triển khai hóa đơn điện tử khởi tạo từ máy tính tiền

Tập trung triển khai hóa đơn điện tử khởi tạo từ máy tính tiền

18:30 , 19/04/2024

Tỉnh Thanh Hóa có trên 1.500 người nộp thuế đã đăng ký sử dụng hóa đơn điện tử khởi tạo từ máy tính tiền. Tuy nhiên, số đơn vị sử dụng giải pháp này chưa nhiều, mới đạt tỷ lệ khoảng 30%.

Việt Nam sắp có thêm tuyến cáp quang biển kết nối Singapore

Việt Nam sắp có thêm tuyến cáp quang biển kết nối Singapore

08:40 , 18/04/2024

Tập đoàn Công nghiệp - Viễn thông Quân đội (Viettel) vừa ký kết biên bản ghi nhớ với Singtel về việc hợp tác triển khai tuyến cáp biển kết nối trực tiếp Việt Nam và Singapore.

Hơn 90% sản phẩm, dịch vụ đạt giải Sao Khuê 2024 tích hợp ứng dụng AI

Hơn 90% sản phẩm, dịch vụ đạt giải Sao Khuê 2024 tích hợp ứng dụng AI

10:15 , 17/04/2024

Hiệp hội Phần mềm và Dịch vụ Công nghệ thông tin Việt Nam - VINASA vừa tổ chức lễ vinh danh và trao giải thưởng Sao Khuê năm 2024. Giải thưởng năm nay đã đổi mới cơ bản cấu trúc với 08 nhóm lĩnh vực, trong đó nhiều sản phẩm, dịch vụ đã được tích hợp các ứng dụng AI.

Khai mạc lớp bồi dưỡng nghiệp vụ sản xuất tin tức trên nền tảng điện thoại thông minh

Khai mạc lớp bồi dưỡng nghiệp vụ sản xuất tin tức trên nền tảng điện thoại thông minh

23:15 , 15/04/2024

Sáng ngày 15/4, tại thành phố Huế, tỉnh Thừa Thiên Huế, Ban Truyền hình Tiếng dân tộc (VTV5), Đài Truyền hình Việt Nam tổ chức lớp bồi dưỡng nghiệp vụ sản xuất tin tức trên nền tảng điện thoại thông minh.

Yêu cầu Netflix dừng quảng cáo, phát hành game không phép tại Việt Nam

Yêu cầu Netflix dừng quảng cáo, phát hành game không phép tại Việt Nam

11:36 , 15/04/2024

Cục Phát thanh, Truyền hình và Thông tin điện tử (Bộ Thông tin và Truyền thông) vừa có công văn gửi Công ty Netflix, yêu cầu tuân thủ quy định pháp luật Việt Nam khi cung cấp dịch vụ trò chơi điện tử trên mạng.

Tăng cường bảo đảm an toàn thông tin mạng

Tăng cường bảo đảm an toàn thông tin mạng

21:30 , 13/04/2024

Thủ tướng Chính phủ Phạm Minh Chính vừa ký ban hành Công điện yêu cầu các bộ, ngành, địa phương tăng cường bảo đảm an toàn thông tin mạng.

Nâng cao hiệu quả sản xuất nhờ ứng dụng công nghệ mới

Nâng cao hiệu quả sản xuất nhờ ứng dụng công nghệ mới

21:17 , 13/04/2024

Đổi mới công nghệ là một trong những biện pháp hàng đầu giúp doanh nghiệp nâng cao năng suất, hiệu quả, khả năng cạnh tranh. Từ đó, không ít doanh nghiệp đã gặt hái thành công thông qua việc đầu tư, đổi mới sáng tạo trong công nghệ sản xuất nhằm nâng cao chất lượng sản phẩm hàng hóa, giúp doanh nghiệp tăng khả năng cạnh tranh trên thị trường.

Chuyển đổi cơ cấu cây trồng gắn với ứng dụng công nghệ cao

Chuyển đổi cơ cấu cây trồng gắn với ứng dụng công nghệ cao

21:13 , 13/04/2024

Những năm qua, việc chuyển đổi cơ cấu cây trồng gắn với ứng dụng công nghệ cao đã được nông dân các địa phương tích cực thực hiện. Từ đó tạo ra những sản phẩm nông nghiệp sạch, chất lượng, gắn với liên kết sản xuất. Đây được xem là xu hướng tất yếu, giúp sản xuất nông nghiệp phát triển theo hướng an toàn hữu cơ.

Ứng dụng khoa học và công nghệ trong truy xuất nguồn gốc sản phẩm

Ứng dụng khoa học và công nghệ trong truy xuất nguồn gốc sản phẩm

21:09 , 13/04/2024

Sau 4 năm thực hiện quyét định số 1221 của UBND tỉnh về “Kế hoạch triển khai, áp dụng và quản lý truy xuất nguồn gốc sản phẩm trên địa bàn tỉnh Thanh Hóa, giai đoạn 2021-2025”, đến nay, toàn tỉnh có khoảng gần 500 cơ sở sản xuất, kinh doanh đã dán tem truy xuất nguồn gốc sản phẩm cho sản phẩm hàng hóa của mình...