ĐÀI PHÁT THANH VÀ TRUYỀN HÌNH THANH HÓA

Thanh Hoa Radio and Television
Đường dây nóng: 0237 3721150

Zalo đạt giải nhất cuộc thi trí tuệ nhân tạo về xử lý ngôn ngữ tự nhiên và tiếng nói

Tại cuộc thi VLSP (Vietnamese Language and Speech Processing) lần thứ 6 năm 2019 do Viện Hàn lâm Khoa học và Công nghệ cùng Trường ĐH Khoa học tự nhiên (ĐHQG HN) tổ chức, Zalo đạt giải nhất về Tổng hợp tiếng nói và giải nhì Nhận dạng tiếng nói.

08/11/2019 14:34

Xử lý tiếng nói tiếng Việt là bài toán khó trong nghiên cứu và phát triển AI tại Việt Nam. Trong nhiều năm qua, bài toán này được đưa vào đề thi của VLSP nhằm kết nối các nhóm chuyên gia của doanh nghiệp, trường đại học và viện nghiên cứu, chia sẻ kinh nghiệm và tìm ra giải pháp tốt nhất trong lĩnh vực xử lý ngôn ngữ tự nhiên và giọng nói tiếng Việt.

VLSP 2019 được phát động từ đầu tháng 9, có 4 hạng mục: Hate Speech Detection on Social Networks (Nhận diện các nội dụng tiêu cực, độc hại trên mạng xã hội), Vietnamese dependency parsing (Phân tích cấu trúc tiếng Việt); Automatic Speech Recognition (Nhận dạng tiếng nói); Text To Speech (Tổng hợp tiếng nói).

 

Zalo đạt giải nhất cuộc thi trí tuệ nhân tạo về xử lý ngôn ngữ tự nhiên và  tiếng nói - 1
 

Nhấn để phóng to ảnh

Ban tổ chức và các đội dự thi tại VLSP

Về đề thi Text to Speech, tập dữ liệu huấn luyện gồm 15.000 đoạn ghi âm giọng miền Nam (tổng thời gian 23 giờ) và gần 1000 đoạn ghi âm giọng miền Bắc (tổng thời gian 45 phút). Sau đó, ban tổ chức gửi cho các đội thi 60 câu văn bản cho mỗi giọng; mô hình AI của các đội thi phải sinh ra file âm thanh những câu đó. Kết quả này được gửi ngẫu nhiên cho 24 người, những người này sẽ chấm điểm dựa trên chất lượng giọng nói và mức độ tự nhiên của file âm thanh.

Điểm khó nhất của đề thi này là là dữ liệu đầu vào khá nhiễu, các đội thi cần lọc sạch dữ liệu để training tốt nhất cho mô hình AI. Tuy nhiên, thời gian xử lý dữ liệu chỉ có 2 tuần khiến cho nhiều đội thi gặp trở ngại. “Team Zalo đã sáng tạo ra giải pháp chuẩn hóa dữ liệu ban đầu hoàn toàn tự động, đây cũng là điểm nổi trội hơn so với các đội thi khác” - ông Nguyễn Quốc Bảo, Lead Scientist của Zalo chia sẻ.

 

Zalo đạt giải nhất cuộc thi trí tuệ nhân tạo về xử lý ngôn ngữ tự nhiên và  tiếng nói - 2
 

Nhấn để phóng to ảnh

Xử lý dữ liệu đầu vào càng tốt, mô hình AI cho kết quả càng cao. (Ảnh: Extemetech)

Ngoài ra, vốn là đơn vị đang tập trung đầu tư nghiên cứu mảng xử lý tiếng nói tiếng Việt, Zalo có thế mạnh về công nghệ và con người. Đơn vị này đang ứng dụng các công nghệ mới nhất hiện nay về xử lý ngôn ngữ tự nhiên và tiếng nói, cùng với đội ngũ kỹ sư AI nhiều kinh nghiệm, team Zalo đã vượt qua nhiều đối thủ đáng gờm, đạt giải nhất với số điểm 3.94/5 hạng mục Text To Speech.

Xử lý tiếng nói tiếng Việt được nghiên cứu ở Việt Nam từ lâu nhưng áp dụng thì chỉ mới bước đầu. Ông Nguyễn Quốc Bảo cho rằng, dữ liệu huấn luyện phải từ 2000 giờ trở lên và đảm bảo đa dạng giọng, vùng miền và cách nói thì mô hình AI - Nhận dạng tiếng nói mới có khả năng áp dụng thực tế tốt. Với những đơn vị đầu tư quyết liệt vào AI như Zalo, cơ hội tiệm cận với các tập đoàn công nghệ hàng đầu thế giới là rất lớn.

Cũng trong sự kiện VLSP 2019, Zalo đạt giải nhì hạng mục Automatic Speech Recognition (Nhận diện tiếng nói).

Theo Dân trí


Ý kiến bạn đọc

Xem thêm bình luận

Đọc thêm

Viettel Thanh Hóa nâng cao chất lượng dịch vụ 5G

Viettel Thanh Hóa nâng cao chất lượng dịch vụ 5G

11:33 , 15/05/2025

Theo dữ liệu công bố từ nền tảng i-Speed của Trung tâm Internet Việt Nam cho thấy, trong tháng 4/2025, Viettel dẫn đầu về tốc độ mạng 5G với 6,2 triệu người dùng 5G cho đến thời điểm hiện tại. Tại Thanh Hóa, nhà mạng Viettel đang tiếp tục mở rộng vùng phủ, nâng cao chất lượng mạng 5G, mang đến những trải nghiệm tốt nhất cho người dùng.

Ứng dụng sáng kiến khoa học trong quản lý, vận hành hệ thống cấp nước sạch

Ứng dụng sáng kiến khoa học trong quản lý, vận hành hệ thống cấp nước sạch

18:39 , 14/05/2025

Thời gian qua, ngành cấp nước Thanh Hoá đã đẩy mạnh phong trào thi đua phát huy sáng kiến, cải tiến kỹ thuật trong công nhân viên chức và người lao động. Qua đó, đã có nhiều sáng kiến, giải pháp khoa học đã được ứng dụng mang lại hiệu quả trong sản xuất, nâng cao chất lượng cấp nước phục vụ khách hàng.

Ra mắt nền tảng AI đột phá về ngôn ngữ: Dùng tiếng Việt đi khắp năm châu

Ra mắt nền tảng AI đột phá về ngôn ngữ: Dùng tiếng Việt đi khắp năm châu

18:28 , 14/05/2025

Công ty Cổ phần Công nghệ Loca AI vừa chính thức ra mắt nền tảng trí tuệ nhân tạo ngôn ngữ mang tên Loca AI với thông điệp "Dùng tiếng Việt đi khắp năm châu".

Tiện ích ứng dụng thuế điện tử eTax Mobile

Tiện ích ứng dụng thuế điện tử eTax Mobile

18:26 , 14/05/2025

Chỉ cần chiếc điện thoại thông minh có kết nối internet, người nộp thuế đã dễ dàng hoàn thành mọi nghĩa vụ liên quan đến thuế, không giới hạn không gian, thời gian. Đó là những tiện ích của ứng dụng thuế điện tử eTax Mobile, giúp giảm thiểu thời gian, chi phí cho người nộp thuế và tăng tính minh bạch, hiệu quả trong quản lý thuế.

Ứng dụng trí tuệ nhân tạo trong sản xuất nông nghiệp

Ứng dụng trí tuệ nhân tạo trong sản xuất nông nghiệp

18:23 , 14/05/2025

Nhằm nâng cao năng suất và hạn chế rủi ro trong sản xuất, hướng tới nền sản xuất nông nghiệp hiện đại, ngành nông nghiệp Thanh Hóa đang tích cực ứng dụng trí tuệ nhân tạo vào sản xuất.

Hơn 34.900 người tham gia Nền tảng nCademy

Hơn 34.900 người tham gia Nền tảng nCademy

16:05 , 14/05/2025

Nền tảng nCademy của Hiệp hội an ninh mạng quốc gia đã mở khóa học miễn phí đầu tiên cho người dùng cá nhân về kỹ năng an ninh mạng. Chỉ sau vài ngày, khóa học đã nhanh chóng thu hút được hơn 34.900 người tham gia.

Thiếu hụt nhân lực có kỹ năng chuyên môn trong lĩnh vực an ninh mạng

Thiếu hụt nhân lực có kỹ năng chuyên môn trong lĩnh vực an ninh mạng

09:42 , 14/05/2025

Báo cáo của Cisco cho thấy, phần lớn các tổ chức tại Việt Nam vẫn đang đối mặt thách thức lớn về tình trạng thiếu hụt nhân lực có kỹ năng chuyên môn trong lĩnh vực an ninh mạng.

Hà Trung triển khai phong trào "Bình dân học vụ số"

Hà Trung triển khai phong trào "Bình dân học vụ số"

20:46 , 12/05/2025

Ngay sau lễ phát động phong trào "Bình dân học vụ số" trên địa bàn toàn tỉnh, huyện Hà Trung đã có triển khai sâu rộng, đồng bộ và hiệu quả phong trào nhằm phổ cập kiến thức và kỹ năng số cho người dân. Từ đó, giúp người dân tiếp cận và dễ dàng ứng dụng công nghệ số vào đời sống cũng như trong công việc, góp phần xây dựng chính quyền số, xã hội số.

Ứng dụng chuyển đổi số trong ngành nghề chế biến thủy, hải sản

Ứng dụng chuyển đổi số trong ngành nghề chế biến thủy, hải sản

14:02 , 12/05/2025

Thời gian qua, UBND tỉnh, ngành nông nghiệp và các địa phương đã khuyến khích các doanh nghiệp ứng dụng công nghệ, chuyển đổi số vào hoạt động sản xuất kinh doanh, đưa các sản phẩm đến gần hơn, nhanh hơn với người tiêu dùng trong và ngoài nước.

Bế mạc và trao giải Hội thi Tin học trẻ toàn tỉnh lần thứ 28 năm 2025

Bế mạc và trao giải Hội thi Tin học trẻ toàn tỉnh lần thứ 28 năm 2025

11:00 , 12/05/2025

Chiều 11/5, Tỉnh đoàn, Sở giáo dục và Đào tạo, Sở Khoa học và Công nghệ, Liên hiệp các Hội Khoa học kỹ thuật, Trường Đại học Hồng và Hội tin học tỉnh Thanh Hóa đã phối hợp tổ chức lễ bế mạc và trao giải Hội thi Tin học trẻ toàn tỉnh lần thứ 28 năm 2025.