Tin tức
Hotline: (84 04) 382 49874      
Hỗ trợ online: Chát với hỗ trợ Online - Yahoo Chát với hỗ trợ Online - Skype  Liên Hệ  Tiếng Anh
http://techmartvietnam.vn/Portals/_default/Skins/NVPortal/Images/xuctien.jpg
http://techmartvietnam.vn/Portals/_default/Skins/NVPortal/Images/xuctien.jpg

Phần mềm tự động số hóa và rút trích thông tin tài liệu SmartDoc 4:10 PM,9/19/2019

Để góp phần nâng cao hiệu quả công tác văn thư, thư viện, nhóm nghiên cứu thuộc Trung tâm Công nghệ thông tin thuộc Đại học Huế do TS Lê Trung Hiếu đứng đầu đã nghiên cứu phát triển thành công phần mềm SmartDoc.

SmartDoc là công nghệ nhận dạng và rút trích thông tin ảnh tài liệu dựa trên kỹ thuật nhận dạng ký tự quang học. Công nghệ là sự kết hợp các kỹ thuật xử lý ảnh tài liệu của Tesseract, các kỹ thuật xử lý ảnh nâng cao, xử lý nhận dạng chữ số viết tay, xử lý ngôn ngữ tự nhiên cho bài toán sửa lỗi chính tả và rút trích thông tin. Trên cơ sở kế thừa các tính năng ưu việt của công nghệ OCR, công nghệ giải quyết được các hạn chế của các chương trình hiện có và đặc biệt phù hợp với việc nhận dạng ký tự và rút trích thông tin từ văn bản hành chính ở Việt Nam. SmartDoc với các chức năng nổi bật, tạo nên sự khác biệt với các phần mềm ứng dụng khác, như:

- Tự động nhận dạng và rút trích thông tin văn bản hành chính; đảm bảo khả năng xử lý với mọi văn bản được soạn thảo theo chuẩn quy định của Bộ Nội vụ, không phụ thuộc vào đặc thù chuyên môn, chuyên ngành của văn bản.

- Ngoài văn bản hành chính, các tài liệu có cấu trúc hay bán cấu trúc, SmartDoc hỗ trợ việc cấu hình tài liệu nhanh, dễ dàng đưa vào phần mềm tự động nhận dạng và rút trích thông tin; hỗ trợ tốt công tác số hoá và rút trích thông tin tài liệu với số lượng mẫu lớn. Hiện SmartDoc đã đưa vào ứng dụng nhận dạng và rút trích thông tin hỗ trợ các ngành y tế; du lịch quản lý các tài liệu như: chứng chỉ hành nghề dược, chứng chỉ hành nghề khám chữa bệnh, giấy chứng nhận nhà thuốc…; quyết định cấp và đổi thẻ hướng dẫn viên du lịch, tài liệu quản lý cơ sở lưu trú du lịch…

- Một chức năng rất quan trọng và có tính ứng dụng cao của SmartDoc là hỗ trợ người dùng tự định nghĩa cấu hình tài liệu cần rút trích với giao diện trực quan, dễ dàng tích hợp với SmartDoc hỗ trợ tự động nhận dạng và rút trích theo định nghĩa cấu hình.

- Với chất lượng scan văn bản khá tốt như phần lớn các văn bản đang lưu hành hiện nay, cùng với chất lượng của các thiết bị số hoá (máy scan chuyên dụng và máy scan phổ thông) ngày càng cao, SmartDoc cho kết quả nhận dạng và rút trích thông tin với độ chính xác trên 95%, đảm bảo tính khả thi trong việc ứng dụng SmartDoc vào các hệ thống quản lý tài liệu thực tế.

SmartDoc cũng đảm bảo nhận dạng các ảnh văn bản có định dạng: PDF, TIFF, JPEG, BMP, PNG… và có khả năng nhận dạng văn bản theo từng vùng chỉ định. SmartDoc hỗ trợ khả năng tích hợp hệ thống dễ dàng, cho phép nhận dạng nhiều văn bản cùng lúc. Tốc độ nhận dạng và rút trích thông tin văn bản cao (5-7 giây/1 trang A4).

SmartDoc hiện đã được sử dụng trong tiếp nhận và lưu trữ, quản lý tài liệu, văn bản gửi đến tại một số đơn vị ở miền Trung như: Đại học Huế, Sở Thông tin - Truyền thông Thừa Thiên - Huế, Sở Thông tin - Truyền thông TP Đà Nẵng.

Thông tin chi tiết, liên hệ: TS Lê Trung Hiếu - Trung tâm Công nghệ thông tin (Đại học Huế);

Địa chỉ: 20 Lê Lợi, TP Huế; Tel: 0909127087; Email: hieukien@hueuni.edu.vn

Nguồn: Tạp chí KH&CN Việt Nam

Send Print  Back
The news brought
Phần mềm quản lý dữ liệu giao, khoán, cho thuê rừng và đất lâm nghiệp 9/19/2019
Nghiên cứu, thiết kế, chế tạo mạng cảm biến không dây hỗn hợp ứng dụng cho giám sát quản lý rừng 9/19/2019
Chế tạo thành công máy tính nhỏ nhất thế giới 8/18/2019
Giọng nói AI không giới tính đầu tiên trên thế giới 8/18/2019
AI nhận diện vật dụng gia đình 8/18/2019
MIT phát triển AI có khả năng phát hiện và tạo ra các hình ảnh giả mạo 8/18/2019
Việt Nam có thể cảnh báo sớm ung thư gan nhờ công nghệ AI 8/18/2019
Công nghệ sạc không dây 8/17/2019
Phát triển máy tính hóa học lưu trữ ảnh bằng phân tử nhỏ 8/17/2019
Tích hợp chip quang học, CPU của tương lai có thể nhanh hơn hàng trăm lần hiện tại 8/17/2019
Học bơi và lặn không ướt áo nhờ công nghệ 8/17/2019
Công nghệ nhận diện gương mặt 8/16/2019
Những công nghệ trên ô tô ngừa lái xe say rượu gây tai nạn 6/10/2019
Trung Quốc phát triển camera có thể "chụp" từ khoảng cách 45km, xuyên sương mù, khói bụi 6/10/2019
Ứng dụng đột phá từ thiết bị chip đọc suy nghĩ người 6/10/2019













Trang chủ   |    CN/TB chào bán   |    CN/TB tìm mua   |    Tin tức   |    Giới thiệu   |    Liên hệ Register   |    Login   
Số lượt truy cập: 120155328 Bản quyền thuộc Cục Thông tin Khoa học và Công nghệ Quốc gia.
Địa chỉ trụ sở chính: 24 Lý Thường Kiệt - Quận Hoàn Kiếm - Hà Nội.
Tel: (84-04) 38249874 - 39342945 | Fax: (08-04) 38249874 | Email: techmart@vista.gov.vn