Trước kia người ta sử dụng một số thiết bị scan chuyên dụng và nhận dạng đánh dấu truyền thống dựa vào nguyên lý phản xạ ánh sáng (tại các vùng có đánh dấu/tô, ánh sáng sẽ phản xạ yếu hơn các vùng trống khác), với các thiết bị này, yêu cầu về việc đánh dấu, tạo mẫu, cũng như yêu cầu về chất liệu giấy in rất khắt khe.

Ngày nay, các phần mềm nhận dạng đánh dấu (Optical Mark Recognition – OMR) cho phép người dùng tự tạo các mẫu cũng như in chúng trên các chất liệu giấy thông thường. Phần mềm chỉ cần làm việc với ảnh quét của mẫu sau khi điền.

EZData-OMR-scannerng nghệ OMR đơn giản hơn rất nhiều so với công nghệ OCR hay ICR. Công nghệ OMR thường được dùng để xử lý dữ liệu từ các phiếu điều tra hay các bài thi trắc nghiệm.

Tham khảo thêm

image004Công nghệ “nhận dạng ký tự thông minh” hay còn gọi là “nhận dạng chữ viết tay” (ICR) là bản dịch từ các ký tự viết tay sang dạng văn bản với ký tự mà máy tính có thể đọc được. Công nghệ ICR là sự phát triển ở mức cao hơn từ công nghệ nhận dạng chữ in (OCR). Đối tượng nhận dạng của công nghệ ICR là chữ viết tay và cả chữ in. Công nghệ ICR tương tự như nhận dạng ký tự quang học (OCR ) và đôi khi sử dụng kết hợp với OCR trong hình thức xử lý.

Công nghệ nhận dạng chữ viết tay thường được sử dụng trong việc nhận dạng thông tin từ các tài liệu dạng biểu mẫu. Trên các tài liệu dạng này, một số thông tin được điền bằng tay tại các vị trí cố định (tờ khai, phiếu đăng ký, bài kiểm tra, v..v…).

Trước khi có công nghệ ICR và OCR, thường người ta khai thác bằng cách nhập dữ liệu lại từ bản giấy sang format điện tử trên máy tính, với dạng tương tự như ở mẫu giấy. Dữ liệu lấy từ các mẫu giấy tờ bao gồm chữ đánh máy hoặc in qua trình soạn thảo, chữ viết tay, đánh dấu tích, mã vạch và chữ ký. Ngày nay, người ta xử lý bằng máy quét, máy chụp ảnh, kết hợp với công nghệ OCR và ICR, và các phần mềm xử lý form để tự động hóa quá trình này trong khoảnh khắc với độ chính xác lên tới 98%, gần tương đương với việc nhập liệu bằng tay.

Tham khảo thêm:

– Principals of Intelligent Character Recognition

Ứng dụng trong điều tra thống kê

 

Chuyển sách báo, văn bản, biểu mẫu tiếng Việt in trên giấy thành tài liệu lưu trữ trên máy tính và có thể chỉnh sửa thông qua các dịch vụ, phần mềm nhận dạng thông minh..

Với sự phổ biến của máy tính, mạng Internet, dữ liệu ngày nay hầu hết được lưu trữ trên máy tính để phục vụ việc tìm kiếm, sao lưu, biên tập.


Hình 1: Tài liệu mẫu kiểm tra các trang web, phần mềm dùng công nghệ OCR.

Nếu bạn là chuyên viên soạn thảo hợp đồng, nhân viên văn thư, muốn lưu trữ các bản hợp đồng, sách báo, các loại công văn tiếng việt… thành dạng văn bản lưu trên máy tính, có thể chỉnh sửa, tìm kiếm theo nội dung. Hoặc bạn là sinh viên đang làm luận văn tốt nghiệp, hiện giữ nhiều tài liệu quý trên bản in và bạn muốn bổ sung vào bài làm của mình để thêm phần phong phú… Nếu dùng máy quét, máy ảnh số để sao chụp, bạn chỉ có thể đọc mà không thể chỉnh sửa.Hiện nay, rất nhiều phần mềm cả có phí lẫn miễn phí dùng công nghệ nhận dạng ký tự quang học hay nhận dạng chữ in, chữ đánh máy (OCR – Optical Character Recognition) – cho phép trích xuất và chuyển đổi tài liệu dạng ảnh (ảnh từ máy quét, máy ảnh, tập tin PDF dạng ảnh…) thành các tài liệu có thể biên tập (dạng tập tin text, Word…) – hỗ trợ việc số hóa tài liệu tiếngViệt (nhận dạng văn bản tiếng Việt). Tùy vào độ phức tạp của văn bản: định dạng chữ hoa, chữ thường, chữ in nghiêng, khung bảng, biểu mẫu…, chất lượng ảnh, và tùy vào công nghệ nhận dạng riêng biệt của mỗi nhà phát triển sẽ có mức độ nhận dạng văn bản chính xác khác nhau. Ngoài công nghệ OCR, hiện nay còn có thêm nhiều công nghệ nhận dạng tiêu biểu khác như:

Hình 2: Kết quả sau khi nhận dạng tài liệu mẫu trên trang free-ocr.com.

Nhận dạng chữ viết tay hay ký tự thông minh (ICR – Intelligent Character Recognition): là sự phát triển ở mức cao hơn của công nghệ nhận dạng chữ in. Đối tượng nhận dạng của công nghệ ICR không chỉ là chữ in mà còn bao gồm cả chữ viết tay. Công nghệ nhận dạng chữ viết tay thường được dùng trong việc nhận dạng thông tin từ các tài liệu dạng biểu mẫu. Trên các tài liệu dạng này, một số thông tin được điền bằng tay tại các vị trí cố định (tờ khai mở tài khoản ngân hàng, tờ khai hải quan, phiếu đăng ký…).

Nhận dạng đánh dấu (OMR – Optical Mark Recognition): một số thiết bị nhận dạng đánh dấu truyền thống dựa vào nguyên lý phản xạ ánh sáng (tại các vùng có đánh dấu/tô, ánh sáng sẽ phản xạ yếu hơn các vùng trống khác), với các thiết bị này, yêu cầu về việc đánh dấu, tạo mẫu, cũng như yêu cầu về chất liệu giấy in rất khắt khe. Ngược với các thiết bị đánh dấu truyền thống, các phần mềm nhận dạng đánh dấu (Optical Mark Recognition – OMR) cho phép người dùng tự tạo các mẫu và in chúng trên các chất liệu giấy thông thường. Phần mềm sẽ xử lý ảnh quét của mẫu sau khi điền. Công nghệ OMR thường dùng để xử lý dữ liệu từ các phiếu điều tra hay các bài thi trắc nghiệm.


Hình 3: Một phần kết quả nhận dạng qua trang free-ocr.com, được sao chép ra tập tin Word.

Nhận dạng chữ mực từ hay ký tự từ tính (MICR – Magnetic Ink Character Recognition): một công nghệ nhận dạng ký tự dùng chủ yếu ở lĩnh vực ngân hàng nhằm tạo thuận lợi cho công tác xử lý kiểm tra thông tin. Công nghệ này cho phép các máy tính có thể đọc các thông tin vắn tắt (như số tài khoản) trên tài liệu in. Không giống như mã vạch, mã MICR con người có thể đọc được. Việc in bằng từ tính cho phép đọc các ký tự chính xác ngay cả khi chúng bị che khuất.

Để minh họa bài viết về công nghệ nhận dạng chữ in (OCR), chúng tôi dùng 2 trang web nhận dạng tài liệu tiếng việt: free-ocr.com, sohoa.com.vn và 1 phần mềm cài đặt trên máy tính: VietOCR. Cả free-ocr.com và VietOCR đều dùng bộ máy (engine) nhận dạng chữ in Tesseract (Tesseract OCR engine) – bộ máy OCR này được phát triển bởi HP Labs trong giai đoạn 1985-1995 và bây giờ là Google (http://code.google.com/p/tesseract-ocr). Với VietOCR, bạn có thể tùy biến theo yêu cầu vì đây là chương trình nguồn mở.

Free-ocr.com là dịch vụ miễn phí, hỗ trợ các định dạng ảnh thông dụng JPG, GIF, TIFF, BMP với dung lượng mỗi tập tin tải lên tối đa 2MB. Dịch vụ này cho phép trong mỗi giờ bạn chỉ có thể thực hiện 10 lần nhận dạng và trích xuất đoạn văn bản từ ảnh.

Hình 4: Giao diện hiển thị kết quả nhận dạng tài liệu trên trang sohoa.com.vn

Sohoa.com.vn là dịch vụ số hóa tài liệu trực tuyến dùng công nghệ nhận dạng tài liệu ADRT (Adaptive Document Recognition Technology) của hãng ABBYY – Nga. ADRT được dùng để nhận dạng các cấu trúc logic, cách dàn trang cũng như các định dạng khác nhau trong tài liệu nhiều trang, ví dụ như: mục lục, đầu trang, chân trang, chú thích, chú thích bảng, chú thích ảnh… Sohoa.com.vn hỗ trợ nhiều định dạng ảnh khác nhau từ TIFF, JPEG, JPEG 2000, PDF, BMP (đen trắng, xám, màu), PNG (đen trắng, xám, màu) cho đến PCX, DCX (đen trắng, xám, màu). Hiện nay, để sử dụng dịch vụ, người dùng đăng ký một tài khoản và sẽ có 30 trang số hóa tài liệu tiếng Việt miễn phí.

VietOCR là một chương trình nguồn mở Java/.NET, hỗ trợ nhận dạng tài liệu tiếng Việt ở dạng ảnh PDF, TIFF, JPEG, GIF, PNG, và BMP. VietOCR có 2 phiên bản: phiên bản Java đòi hỏi Java Runtime Environment, 6.0 hoặc mới hơn. Phiên bản .NET cần Microsoft .NET Framework 2.0 Redistributable. Xem thêm http://vietocr.sourceforge.net.


Hình 5: kết quả (tập tin Word) sau khi nhận dạng tài liệu mẫu qua trang sohoa.com.vn

Để kiểm tra mức độ nhận dạng tài liệu tiếng Việt, chúng tôi đã thực hiện một tài liệu mẫu có cấu trúc gồm: bảng, đánh dấu số đầu dòng, in đậm, in nghiêng, chữ hoa, chữ thường, chia cột, chú thích ảnh. Kiểu chữ (font) dùng trong tài liệu mẫu là Arial, mã Unicode. Đầu tiên, thực hiện quét tài liệu mẫu bằng máy quét (chúng tôi dùng Kodak i4600 Scanner) với độ phân giải 200dpi, ảnh xám (grayscale), định dạng JPG. Xem hình 1.

Sau đó, truy cập free-ocr.com, bạn có thể thực hiện ngay việc số hóa tài liệu mà không cần tạo tài khoản đăng nhập. Chọn ngôn ngữ tiếng Việt, sau đó nhất nút “chọn tập tin” để tải lên tập tin cần nhận dạng. Nhập 2 từ xuất hiện ngẫu nhiên trong ô CAPTCHA, nhấn nút “Send file” và đợi vài giây. Kết quả sau khi dịch vụ free-ocr.com nhận dạng ảnh tài liệu tiếng Việt vừa tải lên: hình 2, hình 3.

Ở đây, bạn có thể dễ dàng nhận thấy, free-ocr.com không nhận dạng được bảng, định dạng chữ in đậm, in nghiêng, cột văn bản, không thể hiện được ảnh cùng chú thích và có một số lỗi nhận dạng chữ. Do đó bạn sẽ phải mất nhiều thời gian để chỉnh sửa và định dạng lại.

Hình 6: tài liệu mẫu (bên trái) và kết quả nhận dạng trên phần mềm VietOCR (bên phải).

Thử kiểm tra với dịch vụ số hóa tài liệu tiếng Việt trên trang sohoa.com.vn. Truy cập sohoa.com.vn, chọn mục “SỐ HÓA”, tạo một tài khoản, đăng nhập tài khoản thành công bạn sẽ có 30 trang nhận dạng miễn phí. Chọn nút “tải file lên”, nhập tiêu đề, chọn ngôn ngữ tiếng Việt, chọn định dạng tập tin xuất ra *.doc (ngoài ra bạn có thể chọn các định dạng tập tin khác: *.xml, *.docx, *.xls, *.ppt, *.pdf, *.csv, *.html, …), nhấn nút “chọn tệp mới” để tải lên ảnh tài liệu tiếng Việt cần nhận dạng, sau đó nhấn nút “thêm mới” để thực hiện. Hình 4. Vài giây sau, kết quả sẽ hiển thị ngay trên giao diện màn hình web, nhấn biểu tượng Word để lưu tập tin đã được nhận dạng về máy. Hình 5.

Kết quả nhận dạng của dịch vụ sohoa.com.vn rất tốt. Tất cả cấu trúc tài liệu: bảng, đánh dấu số đầu dòng, định dạng in đậm, in nghiêng, chữ hoa, chữ thường, chia cột, chú thích ảnh đều thể hiện khá chính xác. Tài liệu sau khi nhận dạng cũng mắc một vài lỗi về chữ.

Sau cùng, chúng tôi thử nghiệm tài liệu mẫu với VietOCR. Truy cập http://sourceforge.net/projects/vietocr tải về bản VietOCR.NET-1.7_32.zip, giải nén và tiến hành cài đặt. Mở chương trình VietOCR, nhấn nút “Open”, chọn tập tin ảnh cần nhận dạng, chọn OCR Language là Vietnamese. Sau đó nhấn nút “OCR” để chương trình tiến hành nhận dạng. Kết quả sau khi nhận dạng: hình 6.

Cũng như dịch vụ free-ocr.com, VietOCR không nhận dạng được bảng, định dạng chữ in đậm, in nghiêng, cột văn bản, không thể hiện được ảnh cùng chú thích – do bộ máy Tesseract 2.0x không hỗ trợ dàn trang, nên chỉ có thể nhận diện văn bản với một cột chữ. Tesseract 3.0 đã tích hợp khả năng phân tích dàn trang, hỗ trợ nhận dạng các văn bản có nhiều cột (xem thêm http://vietocr.sourceforge.net). VietOCR cũng mắc một số lỗi nhận dạng chữ.

Qua các thử nghiệm trên, chúng ta dễ dàng nhận thấy dịch vụ của sohoa.com.vn có khả năng nhận dạng tài liệu văn bản tốt nhất, với đầy đủ định dạng, hình ảnh. Tuy free-ocr.com, VietOCR nhận dạng tài liệu chưa tốt nhưng chúng hoàn toàn miễn phí.

Quốc Dũng

Tham khảo: 
en.wikipedia.org; vietocr.sourceforge.net; free-ocr.com; sohoa.com.vn

photocopy1Như chúng ta thường quen thuộc với cuộc sống hàng ngày, đến các công sở, ngân hàng, doanh nghiệp đều được yêu cầu chứng minh nhân dân và ở đó họ có thể đưa vào máy photocopy để giữ lại bản lưu, nếu không thì yêu cầu bạn cầm đến một bản sao. Mấy ngày sau, có thể sự việc lại được lặp lại nếu bạn quay lại.

Với cách truyền thống này, ngoài sự tốn kém về tiền của nói chung còn là sự lãng phí về thời gian từ việc người dân phải đi “photocopy” cho đến việc cơ quan phải lưu cất và tìm kiếm lại khi cần rồi đến khi có sự cố mất đi thì không thể phục hồi được nữa. Nhiều ngân hàng lại còn “photocopy” ra giấy rồi sau đó có công đoạn scan để lưu trữ điện tử từ bản photocopy trắng-đen đó, vừa nhiêu khê vừa tốn kém.

Ngày nay, với sự phát triển của công nghệ thông tin, với những phương thức “photo” và lưu trữ mới, chúng ta có thể có được những bản photo nhanh chóng, tiện lợi ngay trên bàn làm việc rồi được lưu trữ ngay lập tức trên hệ thống, đó là việc sao chụp và lưu trữ điện tử mà người ta gọi chung là “số hóa văn bản” hoặc đơn giản hơn có thể gọi là “photocopy điện tử”.

v-archive“Photocopy điện tử” là quá trình sao chép bằng những thiết bị sao chụp tài liệu như máy scanner hoặc camscanner V-Scan rồi lưu trữ thẳng trên máy chủ hoặc máy tính mà không cần qua khâu “in ra giấy”. Khi chúng ta cần sao lưu bất cứ loại giấy tờ gì (công văn, văn bản, CMND…) trong quy trình công việc, thì chỉ cần lấy giấy tờ đó, giải phápđặt vào bàn của camscanner và bấm nút rồi V-Scan sẽ xử lý ngay để bạn có được bản số hóa hoàn chỉnh kể cả việc nhận dạng chữ và sau đó V-Archive sẽ giúp công việc lưu trữ, sắp xếp thuận tiện cho việc khai thác về sau. Việc lưu trữ điện tử hết sức cần thiết cho việc lưu lại toàn bộ tài liệu đồng thời tăng khả năng tìm kiếm, tổ chức và chia sẻ một cách đáng kể.

Nếu như việc lưu trữ điện tử không thay thế lưu trữ truyền thống mà chỉ là trợ thủ đắc lực, thì photocopy điện tử có thể thay thế hoàn toàn photocopy truyền thống. Việc từng bước thay thế bản sao bằng giấy bằng sao điện tử là bước đầu để chúng ta gỡ bỏ thói quen, hiện đại hóa và tăng năng suất phục vụ để đáp ứng những yêu cầu ngày càng cao của xã hội.

Online library conceptHiện nay nhu cầu thiết lập “thư viện điện tử” ngày càng cao, vừa để đáp ứng với xu hướng sử dụng hiện tại vừa để tăng năng suất khai thác và chia sẻ thông tin trong thời đại kỹ thuật số. Ngoài ra chúng ta còn rất nhiều thư viện cổ quý giá cần được xã hội biết tới và khai thác mà khả năng tiếp cận bản gốc quá hạn hẹp, hơn nữa nguy cơ bị phá hủy theo thời gian cũng không phải là nhỏ.

Số hóa số lượng lớn những sách hiện có là bước đầu tiên của công tác xây dựng thư viện điện tử. Nhiều nơi thực hiện bằng cách tháo sách ra và scan từng trang một, như vậy vừa lâu vừa không bảo tồn được giá trị thật của quyển sách, nhất là những sách cổ. Trên thế giới đã xuất hiện nhiều công nghệ từ thô sơ đến hiện đại như robot đọc sách để phục vụ cho công đoạn này.

bildeChúng ta vẫn đang kỳ vọng vào những máy chụp sách tự động như robot tự lật trang để tối giảm công sức của con người. Nhưng nếu phân tích rạch ròi về những khoản đầu tư và hiệu quả của nó thì còn nhiều thứ phải bàn. Thứ nhất là những máy sản xuất tại nước ngoài có giá rất cao cộng với các chi phí nhập khẩu thì giá thành tại Việt Nam sẽ đội lên đến mức khó có thể đáp ứng. Ví dụ như máy Copibook Onyx có thể cân bằng bề dày của sách nhưng hoàn toàn vẫn phải lật bằng tay có giá của nhà sản xuất là 32.000 USD, hoặc máy BookDrive Pro, cũng lật trang bằng tay có giá của nhà sản xuất lên đến trên 50.000 USD. Còn máy robot chụp tự động có giá đến hàng trăm ngàn USD. Nếu mỗi máy như vậy chụp hàng triệu cuốn sách thì hoàn toàn xứng đáng với mức độ đầu tư, nhưng trên thực tế chúng ta không đạt được số lượng đó. Thứ hai là rất nhiều máy hiện đại và đắt tiền trên thế giới vẫn dùng biện pháp lật bằng tay vì tay có cảm giác nên chính xác hơn và con người còn phải theo dõi kết quả chụp của trang sách nữa.

DSC_0469DSC_0459Dựa trên những nghiên cứu về nhiều sản phẩm trên thế giới, VIAMI đã quyết định phát triển mô hình máy chụp sách riêng, sử dụng camscanner V-Scan với cơ chế bán tự động. Máy bao gồm 2 phần chính, phần chụp sách có thể úp quyển sách và sức nặng của sách sẽ làm cho trang giấy thẳng ra, đây là phương pháp “chụp úp”. Phần thứ hai là bộ phận cơ học để nâng sách lên, áp vào máy chụp, đây là phương pháp “chụp ngủa” vì quyển sách được để ngửa. Với cả 2 phương pháp trên, khi đặt lệnh chụp (có thể bằng “bàn đạp chân”, hoặc “cú hích đầu gối” hay “nút bấm tay”…) máy sẽ chụp 2 trang cùng một lúc và sau đó người dùng sẽ lật trang bằng tay. Với phương pháp “chụp úp” thì phải nhấc sách lên lật trang và úp trở lại mỗi lần sang trang. Với phương pháp “chụp ngửa” thì chỉ cần một tay sang trang và một tay ấn tay cầm xuống để quyển sách hất lên là chụp được ngay. Cứ như vậy cho đến khi kết thúc quyển sách, mỗi công đoạn này có thể thực hiên trong vòng 2-5 giây cho từng 2 trang.

DSC_0466Ngoài ra nếu có nhu cầu chụp sách mỏng hoặc vở thì người dùng có thể sử dụng công nghệ “máy chụp sách 1 camera”, VIAMI cũng có giải pháp để tách 1 hình ảnh chụp được thành 2 trang rời (như ở hình bên).

Trong mọi trường hợp kể trên, người thực hiện có thể đặt sách ở bất cứ vị trí nào trong khung đã định mà không cần phải căn chỉnh vì phần mềm V-Scan-book sẽ giúp cho việc căn chỉnh tự động.

Sau đó phần mềm V-Scan-book sẽ xử lý toàn bộ những khâu còn lại và đóng gói thành một quyển sách điện tử khi kết thúc công việc. Tất cả đều hết sức đơn giản như lật những trang sách với giá thành hết sức thấp và kết quả không kém gì những máy hiện đại trên thế giới.

Với ứng dụng thư viện điện tử như vậy, chúng ta đang dần chuyển kho tàng trí tuệ khổng lồ của nhân loại vào bộ nhớ máy tính. Nhưng như vậy mới chỉ đóng vai trò lưu giữ những tài sản một cách an toàn hơn mà chưa có đủ công cụ để khai thác một cách có hiệu quả nhất nếu chưa có giải pháp “sao chép nội dung”. Trên nguyên tắc “không phát minh lại bánh xe” (don’t reinvent the wheel), người ta khuyến khích việc thừa kế trí tuệ của nhân loại để sáng tạo và phát triển ra nhiều sự mới mẻ.

V-Scan và V-Archive giúp người dùng có được văn bản dạng text sau khi có bản lưu trữ số hóa. Những nội dung dạng text này được người dùng chỉnh sửa và lưu lại nhằm “huấn luyện” cho phần mềm “hiểu” tốt hơn và cứ như vậy càng về sau càng có được tỷ lệ “dịch thành công” cao hơn.

braun-novamat-slide-projector-963946Việc trình diễn bằng máy chiếu đã trở thành thói quen và không thể thiếu trong các buổi giới thiệu, giảng dạy và đào tạo. Tuy nhiên mọi trình chiếu mới dừng lại ở các Slides Powerpoint đã được soạn thảo trước. Một số nơi có thể được trang bị “bảng thông minh” với “bút điện tử” kết hợp với trình chiếu làm cho buổi trình diễn thêm sinh động, phong phú nhưng chỉ những đơn vị chuyên nghiệp mới có thể sở hữu được những thứ này.Overhead Projector

Nếu chúng ta đi ngược lại dòng thời gian, từ “slide projector” chỉ máy chiếu “phim diapositive” thời những năm 60-80 để trình chiếu như ở hình ảnh trên. Sau đó là phiên bản “máy chiếu vượt đầu” (overhead projector) như ở hình bên mà ở đó người ta đặt phim trong suốt lên mặt máy phát sáng và viết vẽ bằng bút đặc biệt (như bút viết bảng ngày nay) có thể viết lên phim nhựa để trình chiếu, phục vụ các công tác giảng dạy và đào tạo. Loại máy chiếu này giúp các nhà đào tạo hiển thị những ý tưởng cần truyền đạt ngay lập tức, trả lời các câu hỏi tại chỗ bằng máy chiếu và thể hiện một cách sống động bài giảng hoặc trong việc bảo vệ luận án…

Ngày nay những thiết bị này đã biến mất, nhưng nhu cầu thể hiện sống động trong giáo dục và đào tạo không mất đi. Người ta phải khắc phục bằng bảng viết, giấy viết khổ to… nhưng thực chất vẫn chưa đủ to như màn chiếu, còn việc biểu hiện đồ vật cho khán phòng thì hầu như không thể được mà phải thay bằng hình ảnh, clip để chiếu lên màn chiếu, chưa đủ tính thuyết phục nếu phải thực hiện sự thay đổi nào đó.

Scanner-standaloneVới Camscanner V-Scan, công việc “live show” bằng máy chiếu có thể được thực hiện dễ dàng. Bất cứ máy camscanner nào cũng đều có thể chiếu hình ảnh nó thu được ngay trước ống kính lên màn chiếu. Đào tạo viên có thể sử dụng những tài liệu giấy đang có trong tay như sách vở, tạp chí hoặc/và viết vẽ trên một trang giấy… đặt lên trên bàn và chiếu lên màn chiếu. Ngoài ra còn có thể đặt một số vật thể nhỏ để trình chiếu, vật thể có thể đang hoạt động (ví dụ như đồng hồ), kể cả việc phải vận hành hoặc can thiệp bằng tay, v.v… Trong thời gian trình chiếu có thể lưu lại ngay các hỉnh ảnh, kể cả quay phim để làm tài liệu.

Một thiết bị camscanner đặc biệt dành cho công việc này, đó là máy độc lập (A5MPA4AF), thiết bị này có 2 camera và có thể hoạt động độc lập mà không cần phải kết nối với máy tính (nhưng vẫn có thể kết nối được với máy tính như các thiết bị khác khi cần).

Bất cứ một doanh nghiệp nào cũng có thể trang bị một vài máy camscanner V-Scan một cách dễ dàng (giá như một máy scan đơn giản), nhưng lại có thể sử dụng vào việc giới thiệu sản phẩm hoặc đào tạo…

 Scanner-standalone1
Máy quét tài liệu độc lập dùng trong giảng dạy, scan tài liệu khổ giấy kích thước tối đa A4 02camera

– Camera chính (tài liệu): 5 megapixels (2544 x 1936)
– Camera phụ (người): 2 megapixels (1600 x 1200)
– Lấy nét tự động, hoạt động độc lập dùng trong giảng dạy.

Scan các tài liệu , giấy, hóa đơn, CMND, ảnh,… khổ giấy scan có kích thước tối đa A4 (297 x 210 mm).

Tự động xử lý hình ảnh: Nhận dạng viền tài liệu, tự động định nghĩa nếu trang giấy bị khuyết, chỉnh lại góc độ hình ảnh xoay thẳng lại nếu tài liệu bị để lệch góc.

Giá: 9.035.000 VNĐ

Thông số kỹ thuật

Cảm biến hình ảnh:
Độ phân giải hình ảnh:
Khổ tài liệu có thể thu thập:
Kết nối máy tính:
Kích thước máy:
Trọng lượng:
Kích thước hộp:
CMOS, 5.0 Mega Pixels
2544×1936; 640×480
A4, B5, A5, A6, A7, business card, ID card
Có thể hoạt động độc lập hoặc kết nối với máy tính
12x5x50cm (gập), 12x28cmx50cm (sử dụng)
N.W: 1200g, G.W: 2000g
15cmx15cmx60cm
Chiều sâu của màu:
Đối tượng scan chụp:
Tốc độ scan chụp:
Tốc độ truyền:
Định dạng hình ảnh:
Điều chỉnh hình ảnh:
Hiệu ứng (tiêu chuẩn) hình ảnh:
Kiểu lấy nét:
Điều kiện chiếu sáng:
Nhận dạng chữ (OCR):
Giao thức:
Âm thanh:
Chiếu sáng:
Năng lượng tiêu thụ:
Định dạng đầu ra video:
Tiêu chuẩn:
24 bits
Tài liệu, giấy, hóa đơn, CMND, ảnh, vật thể…
Một nút bấm, scan trong 1 giây
30 Fps với phân giải 640×480(VGA)
JPEG, PNG, BMP, TIFF, PDF
Brightness, Exposure, Sharpness, Color, Gain,…
Màu, xám, trắng-đen
Chỉnh độ nét tự động, cân bằng sáng tự động
Đèn LED có độ sáng tự nhiên
Tiếng Anh, tiếng Trung
USB 2.0
Microphone cao cấp
>1Lux
<150mA
YUY2,MJPG
FCC, CE, ROHS
Các chức năng khác Trình chiếu mọi tài liệu hoặc vật thể
Quay phim
Gửi fax
Gửi e-mail
Phần mềm nâng cao V-Scan
Đặt mua ngay

 P02-A4 Photo – scanner 5 megapixel (Có camera phụ chụp chân dung)

– Camera chính (tài liệu): 5 megapixels (2544 x 1936)
– Camera phụ (người): 640 x 480
– Lấy nét tự động, có thêm chức năng chụp chân dung.

Scan các tài liệu , giấy, hóa đơn, CMND, ảnh,… khổ giấy scan có kích thước tối đa A4 (297 x 210 mm).

Tự động xử lý hình ảnh: Nhận dạng viền tài liệu, tự động định nghĩa nếu trang giấy bị khuyết, chỉnh lại góc độ hình ảnh xoay thẳng lại nếu tài liệu bị để lệch góc

Giá: 7.618.000 VNĐ

Thông số kỹ thuật

Cảm biến hình ảnh:
Độ phân giải hình ảnh:
Khổ tài liệu có thể thu thập:
Kích thước máy:
Trọng lượng:
Kích thước hộp:
CMOS, 5.0 Mega Pixels
2544×1936; 640×480
A4, B5, A5, A6, A7, business card, ID card
12x5x50cm (gập), 12x28cmx50cm (sử dụng)
N.W: 800g, G.W: 1400g
15cmx15cmx60cm
Chiều sâu của màu:
Đối tượng scan chụp:
Tốc độ scan chụp:
Tốc độ truyền:
Định dạng hình ảnh:
Điều chỉnh hình ảnh:
Hiệu ứng (tiêu chuẩn) hình ảnh:
Kiểu lấy nét:
Điều kiện chiếu sáng:
Nhận dạng chữ (OCR):
Giao thức:
Âm thanh:
Chiếu sáng:
Năng lượng tiêu thụ:
Định dạng đầu ra video:
Tiêu chuẩn:
24 bits
Tài liệu, giấy, hóa đơn, CMND, ảnh, vật thể…
Một nút bấm, scan trong 1 giây
30 Fps với phân giải 640×480(VGA)
JPEG, PNG, BMP, TIFF, PDF
Brightness, Exposure, Sharpness, Color, Gain,…
Màu, xám, trắng-đen
Chỉnh độ nét tự động, cân bằng sáng tự động
Đèn LED có độ sáng tự nhiên
Tiếng Anh, tiếng Trung
USB 2.0
Microphone cao cấp
>1Lux
<150mA
YUY2,MJPG
FCC, CE, ROHS
Các chức năng khác Trình chiếu mọi tài liệu hoặc vật thể
Quay phim
Gửi fax
Gửi e-mail
Phần mềm nâng cao V-Scan
Đặt mua ngay

SỐ HÓA
TỪ CHUYỆN THƯỜNG NGÀY ĐẾN ĐẠI SỰ

Như chúng ta thường quen thuộc với cuộc sống hàng ngày, đến công sở, ngân hàng, doanh nghiệp đều được yêu cầu chứng minh nhân dân và ở đó họ có thể đưa vào máy photocopy để giữ lại bản lưu, nếu không thì yêu cầu bạn cầm đến một bản sao. Mấy ngày sau, có thể sự việc lại được lặp lại nếu bạn quay lại.

Thiết nghĩ chỉ là 1 bản sao thường để sử dụng lưu nội bộ, hãy làm thử phép tính đơn giản, nếu trung bình mỗi người lớn phải dùng 1 bản photocopy CMND/năm thì xã hội cần đến 50 triệu tờ giấy A4, riêng giá trị tiền giấy đã là 10 tỷ VNĐ, còn tổng giá trị lên đến 50 tỷ VNĐ. Với cách truyền thống, ngoài sự tốn kém về tiền của nói chung còn là sự lãng phí về thời gian từ việc “photo” cho đến việc lưu cất và tìm kiếm lại khi cần rồi đến khi có sự cố mất đi thì không thể phục hồi được nữa.

Theo nhiều quy định của Nhà nước, các doanh nghiệp và cơ quan tổ chức bắt buộc phải lưu trữ những tài liệu, giấy tờ liên quan đến hoạt động trong vòng 10 năm và có thể lâu hơn nữa. Lưu trữ còn giúp tổ chức, doanh nghiệp đỡ nhiều oan ức nếu gặp phải những rắc rối pháp lý nếu xảy ra. Tuy nhiên công việc này cũng hết sức khó khăn và tốn kém đối với mọi tổ chức.

Ngày nay, với sự phát triển của công nghệ thông tin, với những phương thức “photo” và lưu trữ mới, chúng ta có thể có được những bản photo nhanh chóng, tiện lợi ngay trên bàn làm việc rồi được lưu trữ ngay lập tức trên hệ thống, đó là việc sao chụp và lưu trữ điện tử mà người ta gọi chung là “số hóa văn bản”.

Tưởng chừng như vậy đã đủ để thay thế kiểu truyền thống vì đã tiết kiệm được đủ thứ, nhưng cái thực sự được chính là ở các khâu sau đó. Thời gian khai thác sử dụng có thể giảm xuống hàng trăm thậm chí hàng ngàn lần. Ngoài ra còn các chức năng tiên tiến khác như tự động nhận dạng chữ (OCR) cũng giúp chúng ta có ngay được nội dung số. Với công nghệ quản lý tập trung, chúng ta còn có thể xác lập các chế độ bảo mật cao như quản lý người dùng, phân cấp/quyền, backup, quản trị rủi ro…

Để có hình ảnh cụ thể hơn, chúng ta có thể làm phép so sánh đơn giản giữa 2 phương pháp photocopy (sao đơn thuần) như sau:

So sánh giữa các phương pháp sao chép ( photo-copy)

Vấn đề

Truyền thống

Điện tử

Tính pháp lý

Đều không phải là bản chính (chỉ là bản sao tham khảo)

Tính toàn vẹn

Thấp

Cao → rất cao

Tính sẵn sàng

Thấp

Cao → rất cao

Tính bảo mật

Trung bình

Cao → rất cao

Tốc độ phục vụ

Thấp

Cao → rất cao

Thời gian tìm kiếm

Rất cao

Thấp, ngay lập tức

Giá thành lưu trữ

Rất cao

Trung bình

Khả năng dùng lại

Thấp

Rất cao

Khả năng chia sẻ

Rất thấp

Cao

Phòng chống thảm họa

Bất khả kháng (không thể khôi phục nếu đã mất)

Khả thi

Và giữa 2 phương pháp lưu trữ:

So sánh giữa các phương pháp lưu trữ

Vấn đề

Truyền thống

Điện tử

Tính pháp lý

Mặc định

Theo NĐ 01/2013/NĐ-CP

Tính toàn vẹn

Rất cao

Cao

Tính sẵn sàng

Cao

Cao → rất cao

Tính bảo mật

Cao

Cao → rất cao

Tốc độ phục vụ

Thấp

Cao → rất cao

Thời gian tìm kiếm

Rất cao

Ngay lập tức

Giá thành lưu trữ

Rất cao

Trung bình

Khả năng khôi phục

Rất thấp

Rất cao

Khả năng chia sẻ

Rất thấp

Cao

Phòng chống thảm họa

Bất khả kháng (không thể khôi phục nếu đã mất)

Rất cao

Với những so sánh đơn giản trên, chúng ta có thể nhận thấy tính ưu việt hơn hẳn của việc số hóa các văn bản từ khâu photocopy cho đến những công tác văn thư-lưu trữ. Nếu như việc lưu trữ điện tử không thay thế lưu trữ truyền thống mà chỉ là trợ thủ đắc lực, thì photocopy điện tử có thể thay thế hoàn toàn photocopy truyền thống. Việc từng bước thay thế bản sao bằng giấy bằng sao điện tử là bước đầu để chúng ta gỡ bỏ thói quen, hiện đại hóa và tăng năng suất phục vụ để đáp ứng những yêu cầu ngày càng cao của xã hội. Lưu trữ điện tử sẽ mặc nhiên được phát triển khi các nhu cầu photocopy điện tử tăng cao.

Lê Ngọc Quang

scannerDocument-Cam-Scanner

Thiết bị Camscanner: máy scan thông minh

Mini-Portable-Document-Scanner-Camscanner-Copier-X500-

Máy chụp ảnh tài liệu chuyên dụng phục vụ cho quá trình số hóa với chất lượng cao. Thiết bị bao gồm những bộ phận sau:

  • Cánh tay động (có thể đóng vào khi không dùng và mở ra khi sử dụng) bao gồm:
    • Camera (máy chụp ảnh)
    • Microphone
    • Đèn LED và nút điều chỉnh đèn LED
  • Thân cột
  • Chân
  • Cổng cắm USB

Đặc điểm của thiết bị Camscanner

  • camscanner-charCực kỳ cơ động
  • Cực nhanh và thuận tiện
  • Có thể chụp ảnh vật thể
  • Tự động điều chỉnh
  • Có thể chỉnh sửa trước và sau khi chụp
  • Có thể quay phim
  • Camera cho các cuộc họp trực tuyến
  • Có thể làm trình chiếu (qua máy chiếu)
  • Có thể sử dụng làm e-fax
  • Có thể e-mail ngay

Các thông số cơ bản

  • Độ phân giải: 2-5 megapixel.
  • Lấy nét và cân bằng sáng tự động (có thể tinh chỉnh bằng tay).
  • Scan: giấy, sách, ảnh, thẻ, vật khối…
  • Thời gian scan chụp và lưu: 1 giây.
  • Khổ giấy: từ khổ thẻ đến A3.
  • Điều chỉnh: độ phân giải, độ sáng, độ tương phản, màu…
  • Chế độ ảnh: màu, xám, trắng-đen.
  • Format: JPG, BMP, TIF, PNG, RAW…
  • Giao tiếp USB.
  • Ánh sáng: tự nhiên hoặc hỗ trợ đèn LED.
  • Microphone chất lượng cao.
  • Tiêu chuẩn: FCC, CE, ROHS.

Phần mềm miễn phí kèm theo

  • Scan-chụp cơ bản;
  • In mà không cần thông qua file;
  • Fax qua internet không cần giấy;
  • Email ngay;
  • Thu hình video;
  • Lưu trữ văn bản với nhiều format;
  • Nhận dạng chữ (OCR) quốc tế cơ bản;
  • Hiển thị video với các chức năng zoom;
  • Gắp thả files.

 

  • Với các phần mềm client V-Scan: có thể nâng cấp bằng một phần mềm mới thông qua việc download và cài đặt để thay thế phiên bản cũ, mọi dữ liệu đều không bị ảnh hưởng;
  • Với hệ thống V-Archive: Có 3 tầng riêng biệt (lõi, ứng dụng và dữ liệu) nên có thể được nâng cấp bất kỳ lúc nào mà không bị ảnh hưởng đến hoạt động của phần mềm cũng như những dữ liệu đang sử dụng. Có thể được cập nhật bằng sao chép hoặc thông qua FTP archive-networkmột cách tự động.

Khả năng mở rộng của hệ thống V-Archive

Những server rời rạc ban đầu vẫn có thể sẵn sàng cho sự kết nối với nhau nhằm mục đích khai thác tập trung khi cần tạo thành 1 khối dữ liệu lớn:

  • Cho phép khai thác lẫn nhau hoặc khai thác từ một khu vực tập trung.
  • Nếu không có nhu cầu kết nối thì server vẫn hoạt động độc lập, đáp ứng được nhu cầu lưu trữ hiện tại của đơn vị.