Như một xu thế bắt buộc, điện tử hóa để lưu trữ và trao đổi văn bản, tài liệu, thông tin trong môi trường mạng internet đang là chủ đề được bàn luận và nghiên cứu rất nhiều trong khối cơ quan Nhà nước và các tổ chức lớn.

Trong những năm qua, việc điều hành, trao đổi thông tin trong nội bộ cơ quan, giữa các đơn vị với nhau, hay giữa cá nhân và tổ chức đã được điện tử hóa rất nhiều, đây là tín hiệu tốt và mang lại hiệu quả cao trong quản lý, điều hành.

Tuy nhiên do nhiều điều kiện khác nhau như ứng dụng công nghệ thông tin chưa đồng đều, trình độ sử dụng chưa cao, mức độ đầu tư chưa đủ lớn, nên việc tồn tại một khối lượng khổng lồ văn bản, tài liệu, sách báo bằng giấy vẫn còn là một thực tế.

Việc lưu trữ và sử dụng tài liệu giấy gây ra nhiều điều bất tiện từ bảo quản, quản lý, khai thác cho đến truy xuất, sử dụng tài liệu … Tất cả các khâu đều gây ra sự tốn kém, khó khăn, chậm trễ và lãng phí.

Một số cơ quan đã thực hiện việc “file hóa” tài liệu bằng máy quét và triển khai mô hình lưu trữ, quản lý điện tử. Những hệ thống kiểu này đã giải quyết được nhiều vấn đề như chuyển kho tài liệu giấy thành kho tài liệu ảnh để lưu trữ và quản lý trên mạng máy tính, bảo quản tài liệu tốt hơn, tiết kiệm chi phí, có cơ chế quản lý khoa học và đặc biệt việc khai thác của người dùng cũng đã trở nên dễ dàng, nhanh chóng và thuận tiện hơn.

Nhưng nếu đơn thuần chỉ “file hóa” tài liệu mà không chuyển đổi chúng thành dạng tài liệu số thực sự thì ý nghĩa của lưu trữ và quản lý điện tử cũng bị mất đi. Với kho tài liệu là ảnh quét, người dùng không thể thực hiện việc tìm kiếm toàn văn hay việc biên tập lại hoặc trích xuất các thông tin từ văn bản dạng ảnh cũng rất khó khăn và mất thời gian, hoàn toàn là việc gõ lại… Chính vì vậy, nhu cầu về một giải pháp số hóa các kho tài liệu này đã trở nên thiết thực.

Theo khảo sát, hiện nay trên thị trường giải pháp số hóa tài liệu với công nghệ nhận dạng của hãng ABBYY được đánh giá là một sản phẩm tốt, đáp ứng bài toán số hóa với các khả năng như nhận dạng tiếng Việt và 190 ngôn ngữ khác, độ chính xác đạt đến 97 – 98%, giữ nguyên giàn trang của văn bản, cho phép lưu tài liệu ra nhiều định dạng khác nhau như Doc, Excel, và PDF/A (định dạng file tối ưu nhất cho lưu trữ), có cơ chế làm việc tự động không cần giám sát, tính mở cao – dễ tích hợp vào các hệ thống khác để xây dựng nên các dây chuyền số hóa hoàn chỉnh.

Ngoài khả năng số hóa tài liệu mạnh, phần mềm nhận dạng của ABBYY còn cung cấp cơ chế bóc tách thông tin tự động, phân tích và trích xuất các thông tin nhất định trên các biểu mẫu và tài liệu, từ đó kết xuất các dữ liệu này tới các hệ thống quản lý – lưu trữ, thay thế cho việc nhập liệu thủ công như trước đây.

Có thể kể đến một số ứng dụng cụ thể của bóc tách thông tin tự động như: Nhập số liệu từ các loại báo cáo để đưa vào phân tích, nhập thông tin metadata của văn bản pháp qui để đưa vào quản lý, nhập thông tin từ các bộ phiếu survey, nhập thông tin khách hàng từ các application form… Việc ứng dụng bóc tách thông tin tự động mang lại nhiều ý nghĩa như giúp các tổ chức giảm chi phí nhập liệu, tăng tốc độ xử lý công việc, hiện đại hóa qui trình làm việc.

Đánh giá được khả năng làm việc và tính hiệu quả của các phần mềm số hóa tài liệu do ABBYY sản xuất, nhiều cơ quan đã đầu tư và triển khai giải pháp này nhằm số hóa các kho tài liệu khổng lồ hoặc ứng dụng vào việc hỗ trợ vào các công tác nghiệp vụ.

Để đáp ứng tốt nhất cho thị trường, ABBYY đã thiết lập đại diện chính thức và duy nhất tại Việt Nam để cung cấp các thông tin tư vấn, hỗ trợ kỹ thuật và thực hiện các hoạt động thương mại trực tiếp. Đặc biệt, người dùng có thể tham khảo thêm các thông tin chi tiết hoặc dùng thử sản phẩm tại địa chỉ trang web www.sohoa.com.vn.

(Nguồn: Công ty Đông Kinh)

Xây dựng nguồn tài nguyên số là một trong những mục tiêu quan trọng của tất cả các loại hình thư viện trên thế giới, nhằm hướng đến mục tiêu phục vụ thông tin cho người dùng ở mọi lúc, mọi nơi, không phân định không gian, thời gian. Quá trình xây dựng thư viện số, thư viện ảo, thư viện điện tử …đã được phát triển ở các nước phương Tây từ những năm 90 của thế kỉ XX. Nhưng ở Việt Nam, thư viện số, thư viện điện tử mới chỉ được quan tâm từ 6-7 năm trở lại đây. Và rất nhiều các cơ quan thông tin, thư viện hiện nay mới quan tâm tìm hiểu xem thư viện số là gì, xây dựng thư viện số thì cần những yếu tố gì? Trong phạm vi bài tham luận này, chúng tôi đưa ra một số kinh nghiệm triển khai dự án thư viện số để thảo luận.

I. Xây dựng một kế hoạch tổng thể về phát triển bộ sưu tập số

Xây dựng mục tiêu

Việc xây dựng thư viện số là nhằm đáp ứng năm (5) yêu cầu sau [1,13]:

  • Societies – Thoả mãn nhu cầu thông tin
  • Scenarios – Cung cấp dịch vụ thông tin
  • Spaces – Hiển thị đa phương tiện
  • Structures – Tổ chức cấu trúc thông tin
  • Streams – Truyền đạt thông tin

Xác định nguồn tin số hoá/cần số hoá:

2.1. Loại hình văn bản cần số hoá

  • Văn bản & Tài liệu: Sách, tạp chí, bài viết, báo cáo, luận văn, …
  • Âm thanh & Video: Bài nói chuyện, bài giảng, âm nhạc, phim ảnh, …
  • Thông tin địa lý: Hình ảnh, bản đồ, …
  • Thông tin sinh học: con người, động vật, thực vật, gen, …
  • Hình ảnh & Đồ hoạ: Hình ảnh 2D, 3D, bản vẽ kỹ thuật, sơ đồ, …
  • Phần mềm & dữ liệu: chương trình, hình mẫu (model), mô phỏng (simulation), vv…

2.2. Xác định các nguồn/kho tài liệu đã được máy tính hoá

– Tài nguyên trong thư viện: tài liệu dạng truyền thống (sách, báo…), tài liệu đã được máy tính hoá (file âm thanh, file văn bản, các CSDL thư mục, các CSDL toàn văn (luận văn, luận án, hình ảnh…)…

– Các hệ thống liên thông: thư viện khác, bảo tàng, trung tâm thông tin, …

3. Đánh giá cơ sở hạ tầng

–  Cơ sở hạ tầng CNTT: máy tính, máy chủ, hệ thống mạng và các hệ thống lưu trữ dữ liệu. Đánh giá khả năng có kho tài nguyên tại chỗ mang tính tập trung cùng với các hệ thống thư viện liên thông mang tính phân tán. Việc tổ chức liên thông và giao diện sử dụng hiệu quả là nhu cầu chỉ có cổng thông tin có thể giải quyết được
– Con người: kế hoạch yêu cầu có bao nhiêu nguồn nhân lực tham gia, trong đó có bao nhiêu nhân viên cơ hữu có đủ trình độ có thể tham gia dự án ngay, bao nhiêu nhân viên bên ngoài có thể thuê theo sự vụ, bao nhiêu nhân viên cần phải đào tạo để có thể thực hiện được công việc…?
– Nguồn lực tài chính: xác định ngân sách và kế hoạch giải ngân sát với thực tế để đảm bảo tiến độ triển khai dự án/ kế hoạch đề ra.
4. Những yêu cầu về quản lý tài liệu số hoá

  • Đối tượng là các chuỗi dữ liệu (ví dụ các biểu ghi thư tịch, các chuỗi hình ảnh) có cấu trúc (ví dụ Dublin Core hoặc video MPEG-7) kèm theo phương thức sử dụng (không chỉ đơn thuần biểu ghi hoặc nội dung văn bản)
  • Đa ngôn ngữ (Việt, Anh, Pháp, …):
  • Loại hình thông tin: toàn văn (full-text), tóm tắt, siêu dữ liệu
  • Đa phương tiện (multimedia): cấu trúc, chất lượng, tìm kiếm
  • Cấu trúc dựa trên chuẩn XML: DC, MODS, MARC 21 XML, …
  • Bộ sưu tập phân tán: Kleisli, CIMI, Z39.50, …
  • Tìm kiếm tổng quát: thu thập đa nguồn, chọn lọc tự động theo kinh nghiệm, tìm kiếm song song, hoà trộn kết quả
  • Truy cập: Phân quyền, phân cấp, IPR, tính phí, bảo mật và cá nhân hoá
  • Đối với tài liệu trên giấy:
  • Đối với những tài liệu không nhận dạng quang (gọi tắt là OCR) là những tài liệu xuất bản bằng hình thức in roneo, đánh máy chữ và chất liệu giấy rất xấu thì dung lượng sản phẩm phải nhỏ nhưng vẫn giữ được độ sắc nét của chữ, hình ảnh trong tài liệu.
  • Đối với tài liệu OCR (thường là những tài liệu in sau này có chất lượng tốt) thì sản phẩm phải có chức năng tìm kiếm toàn văn nội dung tài liệu (Searchable fulltext). Định dạng của sản phẩm đầu ra phong phú, bao gồm nhiều định dạng: doc, xls, txt, pdf…
  1. Phần mềm quản lý thư viện số và mô hình thư viện số

Phần mềm quản lý thư viện số là một phần không thể thiếu để quản lý nguồn tài nguyên số nói riêng và quản lý khai thác thư viện số nói chung. Hiện nay, có rất nhiều phần mềm quản lý thư viện số từ những phần mềm thương mại của các công ty tin học như phần mềm thư viện số của Công ty CMC, Công ty Tinh Vân, Công ty lạc Việt…, cho đến các phần mềm mã nguồn mở như Dspace, Greenstone… Dưới đây là một mô hình thư viện số cơ bản trên thế giới:
Mô hình thư viện số cơ bản [2]
6. Vấn đề bản quyền tài liệu số hoá
Vấn đề bản quyền là vấn đề rất quan trọng đối với các thư viện hiện nay. Theo Luật sở hữu trí tuệ Việt Nam, những tài liệu dưới đây không được bảo hộ bản quyền:

  • Luật sở hữu trí tuệ Việt Nam 2005; Chương I, Mục 1, Điều 15 “Các đối tượng không thuộc phạm vi bảo hộ quyền tác giả: 1. Tin tức thời sự thuần tuý đưa tin. 2. Văn bản quy phạm pháp luật, văn bản hành chính, văn bản khác thuộc lĩnh vực tư pháp và bản dịch chính thức của văn bản đó. 3. Quy trình, hệ thống, phương pháp hoạt động, khái niệm, nguyên lý, số liệu”
  • Luật sở hữu trí tuệ Việt Nam 2005: Điều 27, khoản (a), (b) “…Tác phẩm không thuộc loại hình quy định tại điểm a khoản này có thời hạn bảo hộ là suốt cuộc đời tác giả và năm mươi năm tiếp theo năm tác giả chết; trong trường hợp tác phẩm có đồng tác giả thì thời hạn bảo hộ chấm dứt vào năm thứ năm mươi sau năm đồng tác giả cuối cùng chết”
Việc số hoá tài liệu cho thư viện số là không vi phạm bản quyền nếu: Tài liệu nằm ngoài bản quyền hoặc tài liệu được bảo hộ bản quyền nhưng số hoá để sử dụng với mục đích phi thương mại trong phạm vi hạn chế của thư viện, trường học, viện nghiên cứu.

Bản thân việc số hoá tài liệu không vi phạm bản quyền, việc vi phạm hay không phụ thuộc vào mục đích sử dụng (chẳng hạn dùng với mục đích thương mại làm ảnh hưởng đến lợi ích kinh tế của người nắm giữ bản quyền là vi phạm) và phạm vi sử dụng (ví dụ nếu phổ biến rộng rãi ra công chúng, ngoài phạm vi thư viện là vi phạm).
Việc download, phát tán tài liệu số hiện nay đang rất phổ biến ở Việt Nam đang ảnh hưởng nghiêm trọng đến quyền lợi của tác giả và các nhà xuất bản mà Nhà nước cần có những quy chế quản lý và xử phạt để bảo hộ quyền lợi chính đáng của tác giả và nhà xuất bản.

II. Giải pháp số hóa tài liệu tài liệu trên giấy
1. Quy trình số hóa tài liệu

 

2. Giải pháp số hóa tài liệu
Đối với loại hình tài liệu không OCR: Tài liệu sau khi scan có thể sử dụng một số phần mềm xử lý ảnh như: Photoshop, OmiPage, … để chỉnh sửa và chuyển đổi sang định dạng pdf. Đối với giải pháp này Công ty Đông Kinh đề xuất sử dụng phần mềm xử lý do công ty nghiên cứu và phát triểnSản phẩm sau khi số hóa:
Ảnh sau khi quét có dung lượng 95MB Ảnh sau khi xử lý dung lượng 115 KB
Sản phẩm đầu ra của phần mềm do Đông Kinh phát triển đạt được các yêu cầu:
  • Dung lượng nhỏ.
  • Độ sắc nét của tài liệu cao.
Giải pháp này có thể áp dụng cho các đơn vị có nguồn lực kinh tế hạn chế, hạ tầng kỹ thuật không cao. Yêu cầu cho giải pháp: Máy scan văn phòng, phần mềm xử lý của công ty Đông Kinh phát triển. Tổng chi phí cho giải pháp chưa đến một ngàn đô la Mỹ.
Sản phẩm đầu ra có thể được quản lý bằng các phần mềm mã nguồn mở sẵn có như: GreenStone, DSpace … Biên mục theo chuẩn Dublincore, XML …
Đối với loại hình tài liệu OCR: sử dụng phần mềm FineReader Engine của hãng ABBYY. Phần mềm này có một số ưu điểm nổi trội so với các giải pháp khác, đó là:
  • Xử lý hoàn hảo đối dữ liệu tiếng Việt: Mặc dù Kofax, Captiva đều là những giải pháp hàng đầu về số hóa và bóc tách thông tin trên thế giới, nhưng tại thời điểm này mới chỉ duy nhất ABBYY FineReader Engine có khả năng làm việc được với các tài liệu tiếng Việt.
  • Độ chính xác: Qua kiểm nghiệm và đánh giá, kết quả nhận dạng và bóc tách thông tin từ Báo cáo tài chính và Giấy yêu cầu mở thư tín dụng đạt trên 99%. Với tổ chức kiểm soát lỗi nhiều mức, kiểm soát lỗi do quá trình nhận dạng cho phép kiểm soát và hạn chế tối đa lỗi.
  • Tính linh hoạt: Với kiến trúc mở và mềm dẻo, ABBYY FineReader Engine cho phép đáp ứng các mô hình triển khai khác nhau, xử lý tập trung, xử lý tại các chi nhánh tùy theo yêu cầu của khách hàng.
  • Khả năng tích hợp: Với khả năng xử lý tất cả các định dạng ảnh phổ biến, làm việc được với tất cả các máy quét thông dụng trên thị trường, cho phép kết xuất kết quả ra nhiều định dạng file (Excel, XML, …) cho phép ABBYY FineReader Engine có thể tích hợp với hầu hết các hệ thống Back Office đã triển khai tại khách hàng.
  • Giữ nguyên bố cục của tài liệu gốc:  ADRT (Adaptive Document Recognition Technology) là một bước tiến lớn trong công nghệ nhận dạng tài liệu; là một phần quan trọng và chỉ có trong công nghệ nhận dạng của ABBYY. ADRT được dùng để nhận dạng các cấu trúc logic, cách dàn trang cũng như các định dạng khác nhau trong tài liệu nhiều trang, ví dụ như: mục lục, đầu trang, chân trang, chú thích, chú thích bảng, chú thích ảnh, số trang v..v…Khi kết quả nhận dạng được lưu dưới dạng Microsoft Word, các định dạng trên được nhìn nhận như những đối tượng tương ứng trong Word chứ không đơn thuần chỉ là các khối văn bản. Để đạt được tính chính xác trong việc phân tích dàn trang, cấu trúc logic cũng như các định dạng trong tài liệu là do ADRT xem xét và xử lý các tài liệu nhiều trang như là một đối tượng tổng thể chứ không phải là tập hợp các trang riêng biệt. Với công nghệ ADRT, người dùng sẽ không mất, hoặc mất rất ít thời gian cho việc biên tập lại kết quả nhận dạng.
  • Kết xuất kết quả nhận dạng: FineReader Engine có khả năng chuyển đổi khối lượng lớn tài liệu giấy sang tài liệu số dưới các định dạng có thể tìm kiếm và biên tập được như MSWord, MSExcel, PDF, PDF/A. Đặc biệt là định dạng PDF/A, là định dạng được coi là định dạng lý tưởng để lưu trữ kết quả số hóa tài liệu hiện nay. Định dạng PDF/A gồm 2 lớp, lớp trên là ảnh quét, lớp dưới là text nhận dạng được.
    • Lớp ảnh quét là hình ảnh trung thực của tài liệu gốc nên nó mang đến cho người đọc tính chính xác của thông tin cũng như hình thức thể hiện.
    • Lớp dưới là text nhận dạng được, là cơ sở để các máy tìm kiếm có thể lập chỉ mục nội dung của tài liệu và qua đó người dùng có thể tìm kiếm nội dung trong tài liệu số.
    • Định dạng PDF/A có một điểm đặc biệt là: lớp text nhận dạng được dàn trùng khớp về vị trí với ảnh gốc. Bởi vậy, cho dù là đang đọc trên lớp ảnh nhưng người đọc có thể sao chép một cách chuẩn xác nội dung số của tài liệu gốc.
– Một số kết quả nhận dạng của tài liệu OCR:
+ Nhận dạng trang sách
+ Định dạng PDF hai lớp
Kết luận
Có rất nhiều các vấn đề mà các nhà thư viện hiện nay cần quan tâm khi xây dựng một kế hoạch/dự án phát triển thư viện số như: phát triển bộ sưu tập số, phát hiện và tổ chức nguồn tin, tìm tin/truy cập, tương tác người – máy/người sử dụng, hạ tầng thông tin-quản trị tri thức, lưu trữ số, dịch vụ số, ứng dụng mạng xã hội, sở hữu trí tuệ, an ninh mạng, các vấn đề văn hoá và luật pháp… Việc xây dựng, phát triển bộ sưu tập tài liệu số cho mỗi thư viện sẽ được tiến hành ở quy mô và mức độ khác nhau dựa trên thực lực của đơn vị cụ thể. Chúng tôi sẽ đi sâu phân tích những yêu cầu cụ thể ở những nghiên cứu tiếp theo.

V-Scan sử dụng các thiết bị camscanner chụp tài liệu trong vòng 1 giây/trang và xử lý tức thì các hình ảnh thu được nhằm mang đến cho người dùng những tài liệu số hóa chỉnh chu và có chất lượng tốt nhất. V-Scan có thể cung cấp ngay các sản phẩm số hóa trên các máy tính cá nhân hoặc cung cấp gián tiếp cho V-Archive để xử lý và lưu trữ. V-Scan có thể được coi là “phần mềm photocopy điện tử”.

V-Scan độc lập (V-SCANST)

Phần mềm V-Scan là phần mềm cao cấp hoạt động trên máy tính cá nhân có tác dụng xử lý cao cấp các hình ảnh cung cấp bởi các thiết bị Camscanner V-Scan như:Output_Document

  • Tự động cắt hình (crop): người dùng có thể đặt tài liệu bất kỳ trong khung nền màu sẫm mà có thể chụp được trọn vẹn và V-Scan sẽ tự động cắt hình dựa trên độ tương phản giữa mặt giấy và nền mặt bàn.
  • Tự động chỉnh góc độ: V-Scan sẽ tự động chỉnh độ chéo góc (perspective) cho hình ảnh sau khi cắt nếu giấy hoặc mSecret_Documentáy camscanner V-Scan bị đặt nghiêng.
  • Tự động xoay thẳng ảnh: sau khi tự động cắt hình và chỉnh góc độ, V-Scan tự động xoay lại hình theo chiều đặt ngang/dọc của tài liệu nếu giấy bị đặt lệch (chọn góc nhỏ nhất để xoay hình về 0° hoặc 90°). Trong tương lai sẽ nghiên cứu khả năng tự động xoay đến 360° để dòng chữ luôn nằm ngang.
  • Các chế độ ảnh: V-Scan vẫn có những lựa chọn về chế độ màu như màu 24 bit, xám (grayscale) và trắng-đen (black and white). V-Scan có thể chọn được camera (nếu có nhiều) và độ phân giải của nó tùy theo nhu cầu.
  • Điều chỉnh độ sắc nét: các thiết bị camscanner V-Scan đã có chế độ tự động lấy nét và cân bằng ánh sáng nhưng vẫn chưa đủ, V-Scan còn tự động (hoặc bán tự động) làm căng độ nét ở chế độ trắng-đen, tô đậm nét chữ chỗ chưa đủ đậm (điều chỉnh threshold) và tự động loại bỏ nhiễu ánh sáng để có được hình ảnh sạch và rõ nét hơn và nhất là phục vụ tốt cho việc nhận dạng chữ (OCR).
  • Chế độ hiệu chỉnh bằng tay: người dùng vẫn có thể xem trước, hiệu chỉnh, cắt khung… bằng tay nếu cần.

V-Scan chụp sách (V-SCANBK)

V-Scan chụp sách được chia ra thành 2 trường hợp:

  1. Máy chụp sách 1 camera: chụp sách 2 trang dính hoặc rời (lẻ và chẵn), máy này thường áp dụng cho những sách mỏng, bìa mềm và gáy nông. Máy này ứng dụng thuận tiện và có thể thực hiện các thao tác khá nhanh;
  2. Máy chụp sách 2 camera: chụp sách 2 trang liền (lẻ và chẵn), máy này thường áp dụng cho những sách dày, bìa cứng và gáy sâu.

Với cả 2 trường hợp V-Scan cũng xử lý như trường hợp trên nhưng có thêm chức năng tự động tách các trang bên lẻ và bên chẵn để thực hiện các công đoạn scan liên tục và sau đó tự động sắp xếp thành sản phẩm sách điện tử.

V-Scan client-server (V-SCANCS)

Đặc tính và các chức năng sử dụng trên máy tính cá nhân cũng giống như V-Scan độc lập, tuy nhiên có thêm vài điểm khác biệt nhằm mục đích tối ưu hóa và bảo mật như sau:

  • Kết nối trực tiếp với phần mềm V-Archive hoặc gửi thông tin trực tiếp tới server đã định trước.
  • Không có file trung gian, giảm thiểu các nguy cơ mất an toàn thông tin.
  • Tạo file PDF/TIFF tự động ngay trên server để “gói” toàn bộ các file ảnh làm file trao đổi. Có thể được gắn ngay lập tức chữ ký số vào file PDF này (nếu cần).

Sản phẩm đầu ra của V-Scan

Kết quả sản phẩm đầu ra của V-Scan có những chế độ sắp xếp tài liệu một cách tự động khi người dùng chủ động thực hiện cho từng tài liệu như sau:

  • Mỗi tài liệu có thể có một hoặc nhiều “cặp” (folder);
  • Mỗi folder có thể được kèm theo một hoặc nhiều tệp (file) số hóa và được sắp xếp theo trang (có thể hàng trăm trang). Các cặp và tệp tài liệu đều được đặt tên tự động hoặc theo ý muốn của người dùng;
  • Có thể được kèm theo rất nhiều thông tin hỗ trợ cho việc tìm kiếm về sau gọi là “siêu dữ liệu” hoặc metadata;
  • Phần mềm có thể tự động ứng dụng luật đặt tên và nhận biết thứ tự chẵn lẻ khi chụp sách với 2 hình ảnh cùng một lúc và sắp xếp theo thứ tự chụp;
  • Sản phẩm đầu ra có thể được lưu trữ trên máy trạm và đồng bộ hóa với server lưu trữ theo ý muốn (trường hợp V-SCANST); hoặc được tự động chuyển ngay lên server (tích hợp với V-Archive hoặc bất kỳ giải pháp lưu trữ nào khác) để server tiếp tục xử lý (trường hợp V-SCANCS).

Sản phẩm đầu cuối của quy trình số hóa này có thể là những file hình nguyên gốc và/hoặc những file hình đã xử lý hay file tài liệu số dùng để chia sẻ và khai thác, tất cả những sản phẩm số hóa đều có thể được lựa chọn và định dạng sẵn nhằm những mục đích khai thác khác nhau.

Thực thể

Mục đích

Quy cách lưu

1

ID định danh

Yếu tố duy nhất để xác định tài liệu

(ID + ID tài liệu)

2

Metadata

Tìm kiếm nhanh

CSDL phi cấu trúc có thể tương tác XML

3

Lưu gốc (tư liệu). Có thể bỏ qua nếu muốn.

Các file số hóa (kể cả multimedia lưu trữ gốc). Những loại files này có thể sử dụng nhiều chuẩn vì được thực hiện theo yêu cầu thực tế của từng vật thể.

RAW, TIFF, JPEG, BMP, PNG…

4

Sản phẩm số hóa (tài liệu)

File lưu truyền, sử dụng và có thể đóng gói thành tậptài liệu để dễ dàng trao đổi, có khả năng gắn được metadata và chữ ký số kèm theo.

– PDF

– TIFF (multi-page)

Cài đặt và triển khai

  1. Máy trạm: Có thể sự dụng mọi loại máy tính cá nhân (PC) với hệ điều hành Windows (Trong tương lai sẽ phát triển thêm ứng dụng trên Linux và MacOS).
  2. Cài đặt: Có thể được cài đặt trên PC hoặc cài sẵn trên 1 bộ nhớ USB (chế độ stand-alone) để tiện sử dụng lưu động.
  3. Triển khai: Có thể hoạt động trong môi trường độc lập không cần mạng sau đó đồng bộ hóa khi có mạng một cách tự động hoặc bằng tay với mọi chế độ bảo mật cần thiết như trọng mạng nội bộ hoặc mạng riêng ảo. Nó cũng có thể hoạt động trực tuyến khi được tích hợp với sản phẩm V-Archive trong trường hợp của sản phẩm V-Scan client/server.
  4. Hỗ trợ: Mọi sự hỗ trợ hoặc sửa chữa trên máy trạm có thể sử dụng “Team Viewer” để kết nối với 1 máy trạm trong mạng của đơn vị để truy cập, như vậy chủ nhân có thể nhìn thấy và kiểm soát mọi hành động của người hỗ trợ từ xa.