Tin tức
Hotline: (84 04) 382 49874      
Hỗ trợ online: Chát với hỗ trợ Online - Yahoo Chát với hỗ trợ Online - Skype  Liên Hệ  Tiếng Anh
http://techmartvietnam.vn/Portals/_default/Skins/NVPortal/Images/xuctien.jpg
http://techmartvietnam.vn/Portals/_default/Skins/NVPortal/Images/xuctien.jpg

Tích hợp công nghệ tiếng Việt vào ứng dụng mobile portal 3:34 PM,2/25/2015

Ngày 12/2/2014, tại Hà Nội, Ban chủ nhiệm Chương trình KC.01/11-15 đã tổ chức họp Hội đồng đánh giá nghiệm thu cấp Nhà nước cho Dự án “Triển khai tích hợp công nghệ tổng hợp tiếng Việt vào ứng dụng mobile portal phục vụ cho đời sống xã hội”, mã số: KC 01.DA01/11-15, thuộc Chương trình Khoa học và Công nghệ (KH&CN) trọng điểm cấp Nhà nước KC.01/11-15 do ThS. Nguyễn Hoàng Trung- Công ty cổ phần Dịch vụ Công nghệ thông tin Naiscorp làm chủ nhiệm đề tài.

Hiện tại, ở nước ta đã có nhiều nhóm nghiên cứu về đề tài xử lý tiếng nói và văn bản tiếng Việt. Tuy nhiên các kết quả nghiên cứu của các đơn vị trên mới chỉ được gói gọn trong phòng thí nghiệm mà chưa được đưa ra áp dụng thực tế hoặc chỉ được áp dụng ở quy mô nhỏ.

Theo ThS. Nguyễn Hoàng Trung, Dự án SXTN này được phát triển từ đề tài cấp Nhà nước “Nghiên cứu phát triển một số sản phẩm thiết yếu xử lý tiếng nói và văn bản tiếng Việt” thuộc chương trình KH&CN trọng điểm cấp Nhà nước, mã số: KC 01.01/06-10, đánh giá nghiệm thu ngày 11/12/2009. Do PGS.TS Lương Mai Chi- Viện Công nghệ thông tin, Viện KH&CN Việt Nam làm chủ nhiệm đề tài. Một số công nghệ cho tổng hợp tiếng Việt đã được khảo sát và nghiên cứu bao gồm phương pháp ghép nối các đơn vị âm cơ bản và phương pháp tổng hợp theo tham số dùng mô hình Marko ẩn.

Một trong những kết quả của đề tài là phát triển engine tổng hợp tiếng Việt theo phương pháp áp dụng mô hình Marko ẩn (engine VieTalk). Ưu điểm nổi bật của phương pháp tổng hợp dựa trên HMM là cho phép phát sinh tiếng nói từ tham số, dễ dàng thay đổi đặc điểm giọng nói, dễ áp dụng cho các ngôn ngữ khác nhau. Nhờ khả năng huấn luyện cho các chủ đề tin tức khác nhau, các mô hình Marko lưu trữ tự động các thông tin về tiếng nói trong một số giới hạn các tham số của mô hình. Trong quá trình tổng hợp ra tiếng nói, việc phát sinh lại tham số tiếng nói để tái tạo âm thanh từ chuỗi liên tục các node trạng thái HMM, giúp tiếng nói tổng hợp trơn và có chất lượng cao. Việc tích hợp engine VieTalk cho Dự án SXTN này là phù hợp về mục đích và yêu cầu kỹ thuật, công nghệ.

ThS. Nguyễn Hoàng Trung cho biết: “Sau khi nghiên cứu nhu cầu của thị trường, tìm hiểu về công nghệ của đề tài do Viện Công nghệ thông tin chủ trì, chúng tôi nhận thấy đây là một thành quả nghiên cứu đã được công nhận và là một cơ sở tốt để tiếp tục nghiên cứu, phát triển thêm các tính năng mới nhằm mục đích ứng dụng công nghệ tổng hợp tiếng nói vào Dự án sản xuất”.

Dự án đã tạo ra một công cụ tổng hợp tiếng nói Online chỉ cần băng thông yếu với 10 kbit/s là người dùng có thể sử dụng dịch vụ sản phẩm. Khi nhận được một yêu cầu, hệ thống tìm ra văn bản phù hợp nhất để tổng hợp tiếng nói và gửi kết quả cho người dùng. Muốn có dữ liệu dạng text để tổng hợp tiếng nói thì phải tạo ra một hệ thống Crawler - lưu trữ dữ liệu - là công việc lấy thông tin có sẵn từ internet, lọc tách dữ liệu cần thiết và lưu trữ sẵn vào hệ thống máy chủ.

Các thành phần, nhiệm vụ của hệ thống là: lấy dữ liệu thô từ internet bao gồm hơn 300 triệu trang webb tiếng Việt được lấy về bằng sever Crawler (sử dụng công nghệ Crawler); dữ liệu đó được lưu trữ vào một kho lưu trữ hàng tỷ văn bản, là đầu vào cho hệ thống tổng hợp tiếng nói với nhiều giọng theo vùng miền và nhiều thể loại khác nhau...

Khi Dự án kết thúc, sản phẩm Mobile Portal đưa vào thị trường với số người sử dụng lên tới hàng triệu, chắc chắn sẽ mang lại hiệu quả kinh tế cao, vì sau khi đưa vào sản xuất đại trà, dự án có thể tạo ra doanh thu 24,6 tỷ đồng kể từ năm thứ 3 trở đi. Bên cạnh đó, ngoài việc mang lại hiệu quả kinh tế cho cơ quan chủ trì đề tài thì sản phẩm của dự án còn mang lại hiệu quả kinh tế cho bên cơ sở nghiên cứu và các bên cung cấp nội dung khác.

Công nghệ tổng hợp tiếng nói theo mô hình Markov ẩn không chỉ cho phép tổng hợp âm thanh tiếng Việt mà còn có thể sử dụng với tất cả ngôn ngữ khác. Dự án cơ thể tiếp tục mở rộng nghiên cứu và triển khai ở một số ngôn ngữ của các dân tộc ít người.

Dự án là sự kết hợp giữa công ty Naiscorp và Viện Công nghệ thông tin, trong đó công ty Naiscorp ứng dụng kết quả nghiên cứu khoa học của Viện Công nghệ thông tin. Về kinh doanh, từ năm 2012 - 2014 dự án đã tạo ra doanh thu 30 tỷ đồng cho công ty Naiscorp.

Kết thúc buổi nghiệm thu, Hội đồng đánh giá cao nhóm thực hiện dự án đã có nhiều nỗ lực bổ sung theo yêu cầu của Hội đồng. Bên cạnh đó, các thành viên hội đồng đã có nhiều ý kiến góp ý về hình thức cũng như nội dung như: hoàn thiện thuyết minh, làm rõ tính mới trong phần mềm sử dụng tiếng Việt khi ứng dụng vào thực tế, cần làm rõ bản đánh giá chất lượng và kết quả đánh giá của sản phẩm, phần doanh thu cần bóc tách rõ ràng về đóng góp của sản phẩm.

Nguồn: Bộ Khoa học và công nghệ, ngày 24/2/2015
Send Print  Back
The news brought
Quét mã vạch trên thẻ bằng điện thoại di động và ứng dụng trong điểm danh 2/25/2015
Công nghệ phát hiện HIV qua điện thoại 2/9/2015
Bàn phím thông minh xác định danh tính người dùng qua cách gõ 2/9/2015
Nghiên cứu ứng dụng ảnh vệ tinh radar trong xác định sinh khối rừng 2/4/2015
Ứng dụng công nghệ GIS trong chữa cháy khẩn cấp 1/14/2015
Nhật Bản phát triển công nghệ diệt khuẩn và khử mùi trên vũ trụ 1/14/2015
Quản lý chương trình tốt hơn trong Windows 8.1 với Start Menu Reviver 2 12/25/2014
Cải thiện sóng wi-fi bằng cừu 12/24/2014
Phần mềm quản trị hệ thống doanh nghiệp hợp nhất AMIS.VN 12/24/2014
Phần mềm trực tuyến kết nối với chuyên gia năng lượng 12/22/2014
Phát hiện phần mềm độc hại đã hoạt động nhiều năm 12/22/2014
Mở cửa phòng khách sạn bằng smartphone 12/19/2014
Rộng mở trước thế giới Internet 12/19/2014
Xây dựng phần mềm tự sửa lỗi 11/24/2014
DARPA đầu tư phát triển công cụ viết phần mềm "bán tự động" 11/13/2014













Trang chủ   |    CN/TB chào bán   |    CN/TB tìm mua   |    Tin tức   |    Giới thiệu   |    Liên hệ Register   |    Login   
Số lượt truy cập: 120636541 Bản quyền thuộc Cục Thông tin Khoa học và Công nghệ Quốc gia.
Địa chỉ trụ sở chính: 24 Lý Thường Kiệt - Quận Hoàn Kiếm - Hà Nội.
Tel: (84-04) 38249874 - 39342945 | Fax: (08-04) 38249874 | Email: techmart@vista.gov.vn