Ra mắt nền tảng công nghệ AI xử lý giọng nói tiếng Việt

Thứ Sáu, 19-06-2020, 18:04
Thứ trưởng Nguyễn Thành Hưng phát biểu tại lễ ra mắt.

NDĐT - Chiều 19-6, tại Hà Nội, Bộ Thông tin và Truyền thông đã tổ chức Lễ ra mắt nền tảng công nghệ xử lý giọng nói tiếng Việt ứng dụng trí tuệ nhân tạo VAIS và Vbee.

Đây là một trong chuỗi sự kiện giới thiệu các nền tảng số “Make in Vietnam” nhằm thực hiện “Chương trình chuyển đổi số quốc gia đến năm 2025, định hướng đến năm 2030” vừa được Thủ tướng Chính phủ phê duyệt.

Phát biểu tại buổi lễ, Thứ trưởng TT-TT Nguyễn Thành Hưng nhận định, Bộ lựa chọn giới thiệu và bảo trợ về truyền thông Nền tảng chuyển đổi giọng nói tiếng Việt thành văn bản VAIS và Nền tảng giọng nói nhân tạo tiếng Việt tự nhiên Vbee vì đây là hai nền tảng tiên phong tại Việt Nam về công nghệ lõi Speech–to–Text và Text–to–Speech sử dụng trí tuệ nhân tạo để chuyển đổi giữa giọng nói và văn bản tiếng Việt.

Nền tảng VAIS hiện đã được nhiều cơ quan nhà nước ở Trung ương và địa phương sử dụng như Văn phòng Trung ương Đảng, Văn phòng Chính phủ, Văn phòng Quốc hội, Bộ TT-TT, UBND Thành phố Hà Nội, hơn 50 đơn vị báo chí, truyền hình để phục vụ gỡ băng bài phát biểu tại các kỳ họp, sự kiện. Nền tảng Vbee đã cung cấp dịch vụ cho hơn 20 nghìn khách hàng cá nhân, hơn 500 doanh nghiệp, tổng công ty, sử dụng rộng rãi trong ba lĩnh vực chính: tổng đài tự động, giải pháp tương tác thiết bị thông minh và nội dung số tự động.

Thứ trưởng tin tưởng rằng, VAIS và Vbee đang đứng trước một thị trường rộng lớn với hơn 96 triệu dân, 700 nghìn doanh nghiệp, 126 triệu thuê bao điện thoại di động, tỷ lệ người sử dụng internet đạt 68,7% (số liệu thống kê năm 2019). Ngoài ra, nền tảng chuyển đổi tiếng nói tiếng Việt thành văn bản VAIS cũng có tiềm năng lớn với khối cơ quan Nhà nước với 22 Bộ, cơ quan ngang bộ, tám cơ quan thuộc Chính phủ, 63 tỉnh, thành phố trực thuộc Trung ương bao gồm toàn bộ các cơ quan hành chính, đơn vị sự nghiệp các cấp.

Đặc biệt, công nghệ giọng nói tiếng Việt có thể được ứng dụng vào các sản phẩm và dịch vụ, cung cấp cho cộng đồng người khiếm thị và người bị câm, giúp người khuyết tật dễ dàng tiếp cận thông tin và sản xuất thông tin, mang lại ý nghĩa xã hội to lớn.

VAIS là nền tảng công nghệ lõi chuyển giọng nói tiếng Việt thành văn bản (Speech to Text) tiên phong tại Việt Nam, với những đặc trưng: Nhận dạng được đầy đủ giọng nói cả ba miền Bắc, Trung, Nam với độ chính xác lên đến 95%. Chuyển đổi giọng nói tiếng Việt thành văn bản với kết quả tức thì, với tốc độ vượt trội có thể nhanh gấp 500 lần thời lượng âm thanh. Nhận dạng tốt trong môi trường nhiễu và ở khoảng cách xa.

Đặc biệt, nền tảng này có tính năng chuẩn hóa văn bản đầu ra: tên riêng, ngày, tháng, số…, hỗ trợ nhiều loại định dạng âm thanh đầu vào. Cung cấp giải pháp cho người dùng trực tiếp hoặc kết nối thông qua API tại: https://vais.vn/.

Vbee là nền tảng công nghệ lõi về giọng nói nhân tạo Việt có cảm xúc (chuyển đổi văn bản thành giọng nói trí tuệ nhân tạo tiếng Việt có cảm xúc – Text to Speech) tiên phong tại Việt Nam với những đặc trưng sau: Công nghệ Vbee có thể học theo bất kỳ giọng của một người nào đó trong vòng bốn giờ đồng hồ với độ tương tự trên 95%. Giọng nói Vbee đa dạng vùng miền (Bắc, Trung, Nam...), giới tính và độ tuổi. Công nghệ giọng nói nhân tạo Vbee có thể dự đoán cách đọc, các từ viết tắt, từ vay mượn, các từ ngữ đặc trưng của tiếng Việt mà các giải pháp nước ngoài không thể.

Vbee xây dựng thành công nền tảng Vbee cloud (https://www.vbee.vn), cho phép người sử dụng, doanh nghiệp, lập trình viên có thể sử dụng trực tiếp hoặc qua tích hợp (API) một cách dễ dàng và thuận tiện.

Vbee đã đóng gói thành công cho các giải pháp toàn diện trong các lĩnh vực sử dụng giọng nói nhân tạo của Vbee như: giải pháp về nội dung nhân tạo (sách nói, báo nói, lồng tiếng phim tự động, thu âm tự động…), giải pháp về tổng đài nhân tạo (vận tải, tài chính, thương mại điện tử…), giải pháp nhà thông minh (giao tiếp với thiết bị qua ngôn ngữ), giải pháp chatbot chăm sóc, tư vấn khách hàng.

PHẠM TRUNG