Chương trình Nhà sáng chế là cuộc thi trên truyền hình dành cho những nhà sáng chế và những phát kiến của họ. Mới đây, GĐ Công ty cổ phần Phần mềm Viami – ông Lê Ngọc Quang đã tham gia chương trình cùng với sản phẩm của công ty – Máy scan tài liệu. Chương trình được phát sóng trên kênh VTV2 ngày 22/7/2014 – số thứ 10.

“Hãy nhớ, bạn của tôi, rằng tri thức mạnh hơn trí nhớ, và chúng ta không nên tin thứ yếu hơn”. Tri thức là nền tảng cho mọi sự phát triển. Xuất phát từ mong muốn lưu trữ kho tri thức cho các thế hệ tương lai, đồng thời vận dụng sự phát triển của khoa học kỹ thuật trong thời kỳ số hóa hiện nay, ông Lê Ngọc Quang đã cho ra đời sản phẩm phần mềm V-Scan, ứng dụng trong máy scan tài liệu Camscanner.

Phần mềm V-Scan là phần mềm cao cấp hoạt động trên máy tính cá nhân có tác dụng xử lý cao cấp các hình ảnh cung cấp bởi các thiết bị Camscanner V-Scan như: tự động cắt hình, tự động chỉnh góc độ, tự động xoay thẳng ảnh, lựa chọn về chế độ màu, điều chỉnh độ sắc nét, chế độ hiệu chỉnh bằng tay. V-Scan có 3 loại: V-Scan độc lập (V-SCANST), V-Scan chụp sách (V-SCANBK) và V-Scan client-server (V-SCANCS).

V-Scan sử dụng các thiết bị camscanner chụp tài liệu trong vòng 1 giây/trang và xử lý tức thì các hình ảnh thu được nhằm mang đến cho người dùng những tài liệu số hóa chỉnh chu và có chất lượng tốt nhất. V-Scan có thể cung cấp ngay các sản phẩm số hóa trên các máy tính cá nhân hoặc cung cấp gián tiếp cho V-Archive để xử lý và lưu trữ. V-Scan có thể được coi là “phần mềm photocopy điện tử”.

Mời các bạn xem thông tin chi tiết tại website và bình chọn tại đây.

cut-and-paste1Ngày nay, trong giao diện tương tác của con người với máy tính, các lệnh “cắt”-“dán” và “sao chép”-“dán” đã trở thành quen thuộc với mọi người dùng trên các hệ điều hành cũng như các phần mềm xử lý văn bản, dữ liệu, tập tin để di chuyển bất kỳ đối tượng nào, từ phía nguồn tới phía đích. Đâu đâu, người dùng cũng đòi hỏi khả năng cắt-dán các phần của văn bản một cách đơn giản nhất. Lệnh “cắt” giúp người ta loại bỏ các dữ liệu được chọn từ vị trí ban đầu của nó, trong khi lệnh “sao” để lại dữ liệu nguyên chỗ cũ; trong cả hai trường hợp trên dữ liệu đã chọn được đặt trong một bộ nhớ đệm (clipboard). Các dữ liệu trong clipboard sau đó được đặt vào vị trí nơi lệnh “dán” được tiến hành.

Tên của lệnh thực chất là một phép toán ẩn dụ giao diện dựa trên các thủ tục vật lý được sử dụng trong chỉnh sửa các đoạn bản thảo để tạo ra một bản chính thức.

Kỹ thuật tương tác này liên quan chặt chẽ với các kỹ thuật đồ hoạ cho người dùng như các thiết bị như chuột máy tính (ví dụ như cách kéo và thả).

Khả năng tái tạo thông tin một cách dễ dàng, thay đổi cuộc sống của chúng ta trong bối cảnh và các ứng dụng, liên quan đến quyền riêng tư vì các nguy cơ tiết lộ khi xử lý thông tin nhạy cảm. Các thuật ngữ như “nhân bản”, “sao chép”, “chuyển tiếp”, hoặc “tái sử dụng”… thông tin hoặc tài liệu có thể bị các quy định hành chính hoặc luật pháp ngăn cản.

Nguồn gốc

Thuật ngữ “cắt và dán” xuất phát từ tập quán làm các bản thảo truyền thống, theo đó người ta cắt một đoạn văn, theo đúng nghĩa đen, từ một trang bằng kéo và dán nó vào chỗ khác hoặc trang khác bằng hồ dán (paste nghĩa là hồ dán đồng thời là động từ dán). Việc này vẫn còn được thực hiện trên thực tế cho đến những năm 1980. Các cửa hàng văn phòng phẩm trước đây thường bán “kéo chỉnh sửa” với lưỡi đủ dài để cắt trang khổ A4, ngoài ra còn bán cả dao nhỏ mũi sắc để có thể cắt những dòng chữ một cách chính xác. Sau này, với sự xuất hiện của máy photocopy có thể thực hiện dễ dàng và linh hoạt hơn, nên các công cụ này cũng dần biến mất.

Hành vi sao chép/ chuyển một phần của một tài liệu trên máy tính từ một vị trí này đến vị trí khác hoặc từ tài liệu này đến tài liệu khác ngay lập tức được xuất hiện. Ngay sau thời kỳ nhập dữ liệu máy tính bằng thẻ đục lỗ kết thúc và chuyển sang thế hệ “bàn phím” (khi chưa có PC) đã bắt đầu có “lệnh” để thực hiện hành vi này. Cơ chế này thường được sử dụng để chuyển các lệnh thường xuyên sử dụng hoặc các đoạn văn bản từ bộ nhớ đệm vào tài liệu, như là trường hợp với trình soạn thảo QED.

Thời sơ khai

Với những trình soạn thảo ban đầu, người ta đã thiết kế ra những thiết bị “bản sao cứng”, có lệnh trên bàn phím để phân định khu vực tiếp giáp của đoạn văn, loại bỏ những vùng này, hoặc di chuyển chúng đến một số vị trí khác. Từ khi có thể chuyển một vùng văn bản, đầu tiên cần loại bỏ nó từ vị trí ban đầu rồi sau đó chèn nó vào vị trí mới là cả một chặng đường cho những phát minh để cho phép thực hiện quá trình phức tạp này. Song song thời đó, đã xuất hiện máy chữ điện tử có bộ nhớ đã giúp cho công việc đánh máy khá thuận tiện.

Thường thì điều này đã được thực hiện bằng cách thực hiện lệnh ‘di chuyển’, nhưng một số trình soạn thảo văn bản đòi hỏi đặt đoạn văn ở một vị trí tạm thời, sau đó phải tìm lại và thay thế. Đến năm 1983, Apple Lisa đã trở thành trình soạn thảo văn bản đầu tiên gọi vị trí tạm thời đó là “clipboard”.

Những hệ thống sơ khai khác như NLS (oN-Line System từ những năm 1960) sử dụng một cơ cấu “động từ – đối tượng”, ở đó tên lệnh được cung cấp trước sau đó đối tượng được sao chép hoặc di chuyển sau. Sự đảo ngược từ “động từ – đối tượng” sang “đối tượng – động từ” mà ở đó người ta sử dụng việc chọn đối tượng trước khi chỉ định hoạt động, là bước ngoặt quan trọng dẫn tới sự thành công sau này của máy tính để bàn vì nó cho phép sao chép và di chuyển các hành động dựa trên thao tác trực tiếp .

Phổ biến

Bắt nguồn từ dòng và ký tự ban đầu, trình soạn thảo đã chia việc di chuyển và sao chép thành hai bước – giữa lúc người dùng có thể chuẩn bị như duyệt menu – Lawrence G. Tesler (Larry Tesler) đề xuất tên “cắt” và “sao” cho bước đầu tiên và “dán” cho bước thứ hai. Bắt đầu từ năm 1974, ông và các đồng nghiệp tại Tập đoàn Xerox Palo Alto Research Center (PARC) đã phát triển một số trình soạn thảo văn bản có sử dụng lệnh cắt/ sao chép và dán để di chuyển/ sao chép đoạn văn.

Apple Computer đã có công phổ biến rộng rãi máy tính dựa trên mô hình cắt/ sao chép và dán thông qua hệ điều hành và các ứng dụng của Lisa (1983) và Macintosh (1984). Apple đã ánh xạ các chức năng với tổ hợp phím bao gồm các phím Command (đặc biệt quan trọng), giữ phím Command rồi gõ các chữ X (để cắt), C (để sao), và V (để dán), lựa chọn một số phím dễ bấm để kiểm soát các hoạt động chỉnh sửa cơ bản. Các phím liên quan thành cụm với nhau ở phía bên trái và các dòng dưới cùng của bàn phím QWERTY, và mỗi phím được kết hợp với một phím chức năng để thực hiện các hoạt động mong muốn:

Z để hoàn tác
X để cắt
C để sao chép
V để dán
Control-V lần đầu tiên được sử dụng để dán trong trình soạn thảo QED.

Tiêu chuẩn của IBM (Common User Access – CUA) cũng sử dụng sự kết hợp các phím Insert, Del, Shift và Control. Phiên bản đầu của của Windows cũng sử dụng tiêu chuẩn IBM. Microsoft sau này đã sử dụng các phương pháp kết hợp bàn phím của Apple khi cho ra đời Windows, lựa chọn phím Control như nút chỉnh sửa mà trước đó họ đã phải dùng các ký tự kiểm soát.

Mô hình tương tự của những tổ hợp phím, sau đó được sao chép lẫn nhau, được lưu truyền phổ biến rộng rãi cho đến nay trong hầu hết các trình soạn thảo bằng đồ hoạ, trình xử lý văn bản, và các trình duyệt hệ thống tập tin…

Cắt và dán

Chỉnh sửa trên máy tính có thể liên quan đến việc sử dụng rất thường xuyên của hoạt động cắt và dán. Hầu hết các nhà cung cấp phần mềm có những biện pháp để thực hiện nhiệm vụ đó, và điều này có thể liên quan đến tổ hợp các phím, các menu thả, menu pop-up, hoặc thanh nút công cụ.

  1. Người sử dụng có thể chọn (tô) hoặc “làm sáng” đoạn văn hoặc file để di chuyển bằng phương pháp nào đó, thông thường bằng cách kéo thả trên văn bản hoặc tập tin tên với thiết bị con trỏ (chuột) hoặc giữ phím Shift đồng thời với các phím mũi tên để di chuyển;
  2. Người dùng thực hiện hoạt động “cắt” thông qua tổ hợp phím Ctrl+x ( ⌘+x trong Macintosh), menu, hoặc các phương tiện khác;
  3. Trực quan, đoạn văn được “cắt” biến mất ngay lập tức khỏi vị trí của nó. Các tập tin được “cắt” thường thay đổi màu sắc để cho biết rằng chúng sẽ được di chuyển đi.
  4. Thông tin được chuyển đến một chỗ mới được gọi từ bộ nhớ đệm (clipboard). Clipboard thường là vô hình. Trên hầu hết các hệ thống chỉ tồn tại một clipboard, do đó sẽ không bị xáo trộn với các thông tin trước đó. Một số trình soạn thảo văn bản UNIX cung cấp nhiều clipboard, cũng như một số chương trình Macintosh dùng Clipboard Master, và Windows dùng quản lý clipboard trong các chương trình như Microsoft Office;
  5. Người sử dụng chọn một vị trí để chèn bằng một số phương pháp, thường bằng cách nhấn chuột tại điểm chèn mong muốn;
  6. Hành động dán diễn ra một cách trực quan như chèn đoạn văn từ clipboard vào điểm cần chèn. (Các hoạt động dán thường không phá hủy clipboard mà giữ lại sẵn sàng cho người dùng để chèn thêm vào các điểm khác).

Trong khi cắt và dán thường xảy ra với chuột hoặc tương đương trong Windows, cũng giống như trong các môi trường giao diện đồ họa khác, nó cũng có thể được thực hiện hoàn toàn bằng bàn phím, đặc biệt là trong các trình soạn thảo UNIX, chẳng hạn như Pico hoặc Vi… phổ biến nhất không dùng chuột mà vẫn dùng cắt và dán.

Khi môi trường phần mềm cung cấp chức năng cắt và dán, hoạt động không phá hủy được gọi là bản sao thường được kèm theo, đặt một bản sao đã chọn trong clipboard mà không cần loại bỏ nó khỏi vị trí ban đầu.

Sao chép và dán

Thuật ngữ “sao chép và dán” được đề cập khá phổ biến, phương pháp đơn giản tái tạo đoạn văn hoặc các dữ liệu từ một nguồn tới một đích. Nó khác với cắt và dán là trong các đoạn văn hoặc dữ liệu gốc không được xóa hoặc gỡ bỏ. Sự phổ biến của phương pháp này xuất phát từ sự đơn giản và dễ dàng mà người dùng có thể sao chép dữ liệu giữa các ứng dụng khác nhau một cách trực quan – mà không cần đến sự sắp xếp lại của lưu trữ vĩnh viễn.

Sao chép thường được thực hiện trên các hệ thống giao diện đồ họa thông qua việc sử dụng các tổ hợp phím Ctrl+C, hoặc bằng cách sử dụng một số phương pháp khác, chẳng hạn như menu hoặc thanh công cụ. Một khi đã sao chép dữ liệu vào bộ nhớ đệm, người ta có thể dán nội dung đó vào điểm đến bằng cách sử dụng tổ hợp phím Ctrl+V, hoặc các phương pháp khác phụ thuộc vào hệ thống như máy tính Macintosh sử dụng các tổ hợp phím ⌘+C và ⌘+V.

Các hệ thống “X Windows” còn duy trì thêm một bộ nhớ đệm luôn chứa các đoạn văn gần nhất và khi nhấn nút chuột giữa thì nó dán clipboard vào bất cứ điểm nào của con trỏ.

Hầu hết các thiết bị đầu cuối và ứng dụng khác nhau đều hỗ trợ các tổ hợp phím Ctrl-Insert để sao chép và Shift-Insert để dán. Điều này phù hợp với người dùng quen với tiêu chuẩn IBM (CUA).

Một số chương trình không chỉ sao chép và dán đoạn văn, mà còn chỉnh sửa trong quá trình, chẳng hạn như PureText (được thiết kế bởi Steve Miller) có thể sao văn bản từ một bảng và loại bỏ bảng trong quá trình dán.

 

Theo Wikipedia

transmissionVào thập niên 60 của thế kỷ 20, sự tương tác giữa máy tính và nghệ thuật cơ bản bắt đầu phát triển mạnh. Tuy nhiên, phải cho đến thập niên 80, thay vì có một tổ chức lớn đứng ra đảm nhận trọng trách này, Alan Kay và cộng sự ở Xerox PARC đã mang sức mạnh của máy tính cá nhân đến với từng cá thể. Mãi đến thập niên 80, truyền thông về cơ bản vẫn ở dạng in ấn và truyền thanh, như phát thanh TV và radio. Nhưng hai mươi lăm năm cuối đã chứng kiến sự chuyển mình nhanh chóng của lĩnh vực truyền thông, sự chuyển mình ấy được khẳng định là nhờ vào việc ứng dụng công nghệ số như là Internet và trò chơi trên máy tính.

Tuy nhiên, những ví dụ ấy chỉ là một đại diện nhỏ bé của truyền thông mới. Máy vi tính được đưa vào sử dụng đã góp phần biến đổi những gì còn sót lại của nền truyền thông “già cỗi”  bằng việc cho ra đời TV số và những ấn phẩm trực tuyến.  Thậm chí những dạng truyền thông truyền thống như báo in cũng có những  chuyển mình đáng kể thông qua việc ứng dụng các công nghệ mới như phần mềm xử lý ảnh Adobe Photoshop và phần mềm xuất bản trên máy tính để bàn.

Andrew L. Shapiro (1999) tranh luận rằng “Các công nghệ số mới xuất hiện đã báo hiệu một sự thay đổi mang tính triệt để vai trò của người quản lý thông tin, kinh nghiệm và nguồn lực” (Shapiro trích trong Croteau and Hoynes 2003, trang 322). W. Russell Neuman (1991) cho rằng trong khi “truyền thông mới” nắm giữ thế mạnh công nghệ để thúc đẩy theo một hướng thì những áp lực kinh tế và xã hội lại thúc đẩy theo hướng ngược lại.

Theo Neuman, “chúng ta đang chứng kiến sự phát triển của một mạng lưới có tính kết nối toàn cầu của audio, video và những kênh liên lạc bằng thư tín – Sự kết nối này có thể làm mờ đi danh giới giữa giao tiếp cá nhân và giao tiếp đại chúng, giữa giao tiếp mang tính cộng đồng và giao tiếp mang tính riêng tư” (trích trong Croteau and Hoynes 2003: trang 322). Neuman cũng cho rằng truyền thông mới sẽ:

  • Thay đổi ý nghĩa về khoảng cách địa lý.
  • Cho phép các kênh giao tiếp được mở rộng mạnh mẽ.
  • Cung cấp phương tiện đẩy nhanh tốc độ giao tiếp.
  • Cung cấp điều kiện cho những giao tiếp mang tính tương tác.
  • Tạo điều kiện cho các hình thức giao tiếp trước đây đã từng bị tách biệt được nối liền với nhau, tương tác lẫn nhau.

Nhờ những tranh luận của các nhà nghiên cứu như Doudlas Kellner và James Bohman mà truyền thông mới, cụ thể là Internet, đã tạo tiền đề cho việc hình thành nên khái niệm về một thế giới dân chủ dành cho tất cả mọi người – nơi mà tất cả công dân có thể tham gia vào những cuộc tranh luận liên quan tới cấu trúc xã hội của họ một cách bình đẳng, không thiên vị với đầy đủ thông tin.

Đi ngược lại quan điểm về ảnh hưởng tích cực của truyền thông mới lên xã hội như đã nêu ở trên là các học giả như Ed Herman và Robert McChesney, người đã chỉ ra rằng, sự quá độ sang truyền thông mới đã chứng kiến việc ra đời của các tập đoàn viễn thông liên quốc gia đầy quyền lực có tầm ảnh hưởng toàn cầu mà đến nay vẫn khó có thể tượng tượng được.

Trong khi đó, các nhà nghiên cứu như Lister (2003) và Friedman (2005), đã nêu bật lên cả những tích cực, tiêu cực cũng như là thực trạng của công nghệ truyền thông mới bằng việc đưa ra ý kiến rằng: một số hành động quá sớm tác động đến nghiên cứu về truyền thông mới thực ra là hệ quả tất yếu của thuyết quyết định[1].

Bởi thế mà những ảnh hưởng của truyền thông được quyết định bởi chính công nghệ của nó nhiều hơn là bởi hệ thống xã hội phức tạp mang lại – hệ thống xã hội này có vai trò quản lý việc gây quỹ, cải thiện và phát triển bất kỳ công nghệ nào trong hiện tại và tương lai.


[1]  Thuyết quyết định (determinism) trong triết học quan niệm rằng để cho một loại hành vi nào đó xảy ra thì cần phải có điều kiện tác động. Hay nói cách khác, với những điều kiện này, thì loại hành vi đó sẽ xảy ra, chứ không phải là hành vi khác.

Nguồn: Wikipedia

 

truyentinTại sao chúng ta phải học truyền tin? Truyền tin là một trong những kỹ năng giúp ích chúng ta rất nhiều trong sinh hoạt kỹ năng. Nói đến việc học nó thì không phải một sớm một chiều là có thể thành công ngay mà nó đòi hỏi chúng ta phải cần cù siêng năng.

Thật thú vị biết bao khi ta có thể dùng môn này để nói chuyện với bạn mình bên kia đường mà người khác không hiểu được nội dung. Truyền tin liên lạc có giá trị rất lớn trong trường hợp liên lạc giữa bạn bè với nhau trong miền hoang vu, hoặc ở hai bờ sông lớn, hay địa hình hiểm trở và thông tin cứu hộ. Vậy thì ta thử quan tâm xem lịch sử truyền tin được phát triển như thế nào?

Từ thời thượng cổ, loài người đã biết dùng những tiếng hú, tiếng kêu riêng để gọi nhau mà chỉ người cùng bộ tộc mới biết được. Rồi đến những thông tin đầu tiên là những hình vẽ trên da thú hay trên những vách hang động mà chúng ta biết được qua báo đài.

Thời Hy Lạp cổ, trong cuộc chiến ở làng Marathon có một chiến binh đã dũng cảm băng rừng lội suối, bất chấp mọi gian khổ để chạy về báo tin thắng trận, vì quá kiệt sức với đoạn đường tương đương 42,195 km, anh ta về thành Athene chỉ kịp nói được hai chữ “Chiến thắng” thì tắt thở. Đó được xem như là chiến công vẻ vang nhất của ngành truyền tin thời bấy giờ. Sau này để ghi nhớ chiến công này người ta đã tổ chức cuộc thi chạy việt dã cùng với cự ly như vậy.

Lần lượt theo nhu cầu mà con người nghĩ ra cách truyền tin nhanh chóng và xa hơn. Các bộ lạc da đỏ Châu Mỹ có cách liên lạc với nhau bằng khói, cũng như người thổ dân Phi Châu dùng nhịp trống ngắn và dài để báo tin.

Ngoài ra người ta còn sử dụng ngựa và bồ câu liên lạc. Ngay từ cuối thế kỷ XII, Thành Cát Tư Hãn có một đội quân liên lạc bằng kỵ binh mang tên “Mã Khoái”, đã góp phần lớn vào chiến thắng của quân Mông Cổ lúc bấy giờ. Vào thời kỳ này hệ thống giao thông liên lạc hết sức khó khăn nhưng Thành Cát Tư Hãn đã tổ chức một hệ thống trạm dọc theo các trục lô chính, sử dụng các kỵ sĩ cởi thiên lý mã suốt đêm ngày, đảm bảo liên lạc xuyên suốt mà các đế quốc khác chưa thực hiện được. Cũng với hình thức tương tự mà mãi sau này ở miền viễn Tây nước Mỹ người ta mới thành lập một công ty mang tên “Ngựa con tốc hành” để chuyển tải thư tín bằng người từ bang Sacramanto đến bang St.Joseph trong vòng 10 ngày đó là kỷ lục truyền tin lúc bấy giờ. Ở Việt Nam, Trần Nguyên Hãn trong thời kỳ chống giặc Minh đã sử dụng bồ câu liên lạc góp phần vào chiến thắng chống ngoại xâm của dân ta.

Tại Anh, tướng Jonh Smith là người đầu tiên phát minh lối dùng lửa truyền tin trong quân đội. Năm 1792 chính phủ Pháp có thể chuyển những thông điệp đi khắp Châu Âu với vận tốc 1.500 dặm một giờ. Từ Pari, hoàng đế Pháp có thể truyền các chỉ dụ đến các vị tướng của ông bên bờ sông Rhine cách đó 150 dặm trong vòng 6 phút! Bằng cách nào? Đó là hệ thống tín hiệu do Claude Chappe phát minh năm 1792. Người ta xây dựng những tháp cao khắp nước Pháp và Châu Âu, mỗi tháp mang trên đỉnh hai cây cờ khổng lồ mà các tháp kia có thể nhìn thấy qua kính viễn vọng từ khoảng cách 10 dặm. Người điểu khiển hai ngọn cờ đánh vần từng chữ cái trong thông điệp bằng cách giương cờ ở những vị trí khác nhau. Ngọn tháp cao được gọi là Semaphore. Đến nay, cột tín hiệu và các mã Semaphore vẫn còn được sử dụng trong hải quân và lục quân của nhiều nước trên thế giới.

Những phương tiện thông tin trên dù sao cũng xem là chậm và đôi khi còn sai lạc, nếu gặp luồn gió mạnh thổi ngược chiều, những ngày trời xấu, mưa, bão. Do đó để theo kịp tốc độ phát triển về mọi mặt của đời sống con người, ngày càng có những phát minh làm cho việc truyền tin hiệu quả hơn. Trong đó cùng với máy phát điện, tín hiệu Morse đã ra đời tạo một bước ngoặc lớn cho lịch sử truyền tin của con người.

Samuel Morse sinh năm 1791, mất năm 1872. Ông là một nghệ sĩ vẽ chân dung và là người sáng lập Hàn lâm viện Nghệ Thuật Quốc Gia Hoa Kỳ năm 1825. Sau khi Edison phát minh ra máy phát điện. Vào năm 1837, ông đã phát minh ra ám hiệu truyền tin dựa trên đặc tính khi ta ngắt mở dòng điện sẽ gây nên tín hiệu (tích, te) thể hiện trên cuộn giấy đang chạy. Ám hiệu này phổ biến năn 1844 và được thay thế bằng biểu tín hiệu mang tên ông. Càng ngày tín hiệu Morse càng phát triển và vào năm 1902 ông Maconi truyền tín hiệu Morse lần đầu tiên là chữ “S” bằng vô tuyến điện qua Đại Tây Dương.

Ngày nay, sự phát triển nhanh chóng của KHKT đã hiện đại hóa việc liên lạc. Bây giờ chúng ta có thể trò chuyện thoải mái hàng giờ bằng hệ thống điện thoại. Cao hơn nữa trong những năm của thập kỷ 90 với sự ra đời của World Wide Web, một người có thể liên lạc cùng lúc với nhiều người khác nhau bằng hệ thống Internet toàn cầu. Đến năm 1998, trên thế giới đã tuyên bố chấm dứt thời kỳ liên lạc bằng Morse, mở ra thời kỳ liên lạc bằng kỹ thuật số.

Nguồn: Thanhnien.hue.gov.vn

Trải qua thời gian, công việc sao chép tài liệu đã có nhiều bước thay đổi cả về phương pháp lẫn công nghệ.

Viết lại

Sao chép hoàn toàn bằng tay, nghĩa là nhìn thế nào thì ghi lại như thế, công việc này đòi hòi mức độ trung thực và chính xác cao. Sau đó nếu muốn chứng thực bản sao chép đó người ta phải ra cơ quan chính quyền xin dấu chứng nhận cho bản sao. Hầu hết những người miền Bắc Việt Nam đã trải qua thời kỳ chiến tranh đều có những “bản sao giấy khai sinh” kiểu như vậy (vì giấy khai sinh đã bị giữ lại để làm sổ gạo và thất lạc hoàn toàn).

Sao bằng giấy than

Việc sao chép này được thực hiện bằng cách đặt 1 đến 3 tờ giấy than xen kẽ giữa các lớp giấy sau đó viết hoặc dùng máy đánh chữ để ghi lên bản chính và từ đó in hằn lên các bản sao tạo nên các bản sao. Với kỹ thuật này đòi hỏi giấy rất mỏng do đó thường phải dùng giấy poluya, nhưng những bản sao để phía dưới bản chính càng xa thì càng mờ dần và khó nhìn. Để có được bản sao một cách chắc chắn là không bị giả mạo thì người ta còn chế ra “giấy than 2 mặt” nhằm in hằn cả mặt trái lên bản chính và các bản sao nữa. Cho đến những năm 90 của thế kỷ 20, giấy than vẫn được dùng phổ biến ngay ở các nước tiên tiến.

Sao bằng giấy can

Phương pháp này là sử dụng giấy trong và tương đối cứng đặt lên bản chính để tô và vẽ lại và thường được áp dụng cho những bản vẽ kỹ thuật. Sau đó người ta có thể đưa giấy can đã được vẽ lại ra in ronéo hoặc các hình thức in âm bản khác. Thời những năm 60-80, giấy can cực kỳ thịnh hành trong mọi cơ quan thiết kế.

Sao bằng âm bản

roneoKỹ thuật ronéo thật ra là một kỹ thuật in đã lâu (từ đầu thế kỷ 20). Người ta lắp 1 tờ giấy Stencil vào máy đánh chữ (còn gọi là giấy sáp). Giấy này có 3 lớp kết dính với nhau. Lớp thứ nhất (lớp sáp) để khi gõ bằng máy đánh chữ (không kẹp rubăng) thì tạo lỗ thủng trên giấy. Lớp thứ 2 là lớp giấy than (có tác dụng làm nổi chữ khi đánh máy). Lớp thứ 3 là giấy bìa dầy để giữ stencil không chạy lệch.

Đầu tiên là đánh máy chữ (sau này dùng máy in kim) để in lên giấy stencil tạo lỗ thủng trên giấy này, sau đó lắp giấy stencil (xé miếng giấy than ở giữa và miếng bìa cuối bỏ đi) và đặt lên một máy quay (gọi là máy quay ronéo – máy này được chạy bằng điện, quay bằng tay có 2 bầu mực, 1 lưới lược mực, có máy dùng ống tuýp mực ống con ngựa gắn vào).

Máy photocopy (copier)

Photocopies-Pic2Đó là máy dựa trên cơ chế của scanner, đọc bản chính bằng thiết bị quang học sau đó in lại bản sao và có thể in lại rất nhiều bản. Máy photocopy đã phát triển nhanh chóng và phiên bản sau luôn hiện đại, nhiều chức năng hơn phiên bản trước. Thương hiệu Xerox nổi tiếng bởi khẩu hiệu “In the world of copies, we are the original” (trong thế giới của các bản sao, chúng tôi là bản chính) và cái tên “xerox” trở thành danh từ chung cho máy hoặc công việc photocopy tại nhiều nước.

Máy fax (facsimile) là 1 dạng biến thể của máy photocopy có kèm theo thiết bị truyền dữ liệu qua đường điện thoại được gọi là modem.

Sau giải phóng, loại máy này bắt đầu vào Việt Nam, nhưng phải đến những năm 90 mới được phổ biến. Đến nay, do yêu cầu quản lý của các cơ quan nhà nước và chính các doanh nghiệp đều  yêu cầu phải lưu trữ các bản sao khi làm bất kỳ thủ tục hồ sơ nào đó nên máy photocopy  trở thành phổ biến, hầu hết các cơ quan văn phòng đều trang bị máy photocopy, nếu không tự trang bị máy photocopy thì đều phải ra ngoài thuê dịch vụ.

Thiết bị số hoá

DM632Nhu cầu sử dụng các bản sao ngày càng nhiều nảy sinh yêu cầu lưu trữ các bản sao ngày càng lớn đến mức không thể lưu trữ được chúng, các cơ quan công quyền luôn yêu cầu có bản sao đi kèm để giải quyết những thủ tục hành chính nhưng sau khi giải quyết xong rất nhiều bản photo buộc phải hủy bỏ và từ đó đã phát sinh ra  “máy huỷ giấy”.

Các thiết bị số hoá là các thiết bị dùng để sao chép nội dung các tài liệu giấy thành các file tài liệu điện tử hoá hay còn gọi là tài liệu số hoá. Tài liệu số hoá được lưu trữ trên các thiết bị lưu giữ điện tử gọi chung là “lưu trữ điện tử”. Các thiết bị số hoá bao gồm: máy scan (scanner) còn gọi là máy quét, máy chụp ảnh và hình thức mới hơn là camscanner nghĩa là máy quét tài liệu bằng phương pháp chụp ảnh.

Ngày nay các thiết bị số hoá không những trở thành nhu cầu thiết yếu của thời đại mà còn là động lực của sự phát triển công nghệ, các ứng dụng phục vụ cho các ngành công nghiệp và dân sinh.

Trước kia, khi chưa có máy “photocopy”, để sao lưu một tài liệu, văn bản người ta phải ghi chép lại bằng giấy than, sao lại bằng in ronéo hoặc thậm chí phải viết lại bằng tay (rồi đóng dấu sao y bản chính nếu cần chính thức hoá).

copierKể từ khi có máy “photocopy” (copier), cuộc sống trở nên dễ chịu hơn hẳn, tốc độ ngày càng cao, chức năng ngày càng thân thiện với người dùng và chất lượng ngày càng tốt như “bản chính”. Hầu như chỗ nào có cơ quan công quyền, trường học hay những nơi đông người qua lại cần đến giấy tờ đều có một cửa hàng sẵn sàng phục vụ quý khách hàng.

Nay, photocopy phổ biến đến mức đâu đâu cũng có và đâu đâu cũng đòi hỏi, chưa chắc cần cũng đòi hỏi hoặc ai đi đâu, đến cơ quan nào đi chăng nữa cũng “thủ” một vài bản sao photo cho chắc… Nếu không lại bị bắt phải chạy ra ngoài “photo”…

Bạn cần làm thủ tục gì đó ở UBND phường, việc tối thiểu bạn phải làm là “photo” CMND, hộ khẩu hay bất cứ giấy gì có liên quan đến việc bạn cần. Bạn cần công việc gì đó ở phòng “một cửa” thì bạn hãy nghĩ ngay là “cửa” không kém phần quan trọng là “photocopy”. Bạn đến bệnh viện mang theo CMND và thẻ bảo hiểm, bệnh viện đòi bạn 2.000 VNĐ để “photo” CMND và thẻ bảo hiểm. Bạn đến ngân hàng để mở tài khoản, ngân hàng cần có CMND của bạn để lưu lại trên hệ thống (hiện đại quá), nhưng họ không lưu lại ngay đâu mà “photocopy” và sau đó chuyển sang bộ phận khác để “scan lại bản sao” và lưu bản số hoá lên hệ thống… Những câu chuyện thường ngày như vậy vẫn xảy ra xung quanh chúng ta.

Thiết nghĩ, với chi phí 1.000 VNĐ/trang, dịch vụ photocopy dường như rất nhanh chóng và thuận tiện, mọi người đều thoải mái khi bỏ ra khoản tiền ít ỏi đó để giải quyết các vấn đề. Nhưng nếu chúng ta hãy thử đặt ra một phép tính đơn giản, nếu trung bình mỗi người lớn phải dùng 1 bản photocopy CMND/năm thì xã hội cần đến 50 triệu tờ giấy A4, riêng giá trị tiền giấy đã là 10 tỷ VNĐ, còn giá trị của bản photocopy là 50 tỷ VNĐ. Nhưng trên thực tế con số này còn lớn hơn nhiều vì không chỉ có CMND. Ngoài sự tốn kém về tiền của nói chung, còn là sự lãng phí về thời gian từ việc phải đi “photo”, đi tìm cửa hàng “photo” chưa kể đến nhiều khi phải vứt đi vì không dùng đến.

Còn hơn thế nữa, tại các cơ quan công sở cũng như các doanh nghiệp, việc lưu giữ các bản photocopy đã thu thập trong quá trình hoạt động quả là một sự tốn kém về tiền của và công sức vô cùng lớn. Hãy tưởng tượng những nhà kho giấy ngày một chồng chất cộng thêm với những chi phí bảo quản không hề nhỏ. Đến khi cần đến một tài liệu nào đó thì vô cùng tốn công tìm kiếm trong điều kiện môi trường độc hại hoặc yếm khí của nhà kho. Chính vì thực tế trên mà đa số các cơ quan sau khi đã xem xét xong công việc (với đầy đủ các bản photocopy) thì họ vứt bỏ hoặc huỷ chúng đi, lại một lần nữa là sự lãng phí.

Những đòi hỏi “sao lưu” tại bất cứ cơ quan, tổ chức nào đều hết sức cần thiết và hoàn toàn chính đáng. Nhưng nếu những sao lưu này được lưu truyền tự động giữa các bộ phận liên quan để dễ dàng tiếp cận và sử dụng thì chúng mới thực sự mang lại lợi ích. Thời đại công nghệ thông tin đã cho chúng ta những công cụ “sao lưu điện tử” với đầy đủ những tính ưu việt nổi bật và chi phí thấp, làm cho cuộc sống của chúng ta ngày càng tươi đẹp hơn.

Vào sáng nay, ngày 26/06/2014 tại trường Đại học Nội vụ Hà Nội đã diễn ra buổi tọa đàm khoa học “Phát triển chương trình đào tạo ngành lưu trữ bậc Đại Học đáp ứng nhu cầu xã hội”.

Tham gia buổi tọa đàm có Ban lãnh đạo trường Đại học Nội vụ Hà Nội  đại diện là PGS.TS Triệu Văn Cường – Hiệu trưởng , các thầy cô giáo khoa Văn thư – Lưu trữ của trường, cùng  với sự góp mặt của các chuyên gia trong lĩnh vực quản lý Văn thư – lưu trữ: PGS.TS Dương Văn Khảm – Nguyên cục trưởng cục Văn thư lưu trữ nhà nước; GS.TSKH Nguyễn Văn Thâm – Nguyên trưởng khoa văn bản & công nghệ hành chính của Học viện Hành Chính; PGS.TS Vũ Thị Phụng – Chủ nhiệm khoa lưu trữ học & quản trị văn phòng – Trường ĐH KHXH&NV-ĐHQG HN; PGS.TS Lê Đức Ngọc – Giám đốc trung tâm CAMEEQ-VIPUA;..Các đại diện của cơ quan quản lý nhà nước về văn thư lưu trữ (Cục văn thư và lưu trữ nhà nước; Cục lưu trữ văn phòng Trung Ương Đảng); Các cán bộ quản lý công tác văn thư – lưu trữ tại các cơ quan tổ chức (Văn phòng Quốc Hội; Bộ KHCN; Lưu trữ dầu khí; Viện hàn lâm khoa học xã hội Việt Nam);  Chuyên gia về phát triển công nghệ (Ông Trần Quang Kỳ – Ban cơ yếu chính phủ – Bộ QP; Ông Lê Ngọc Quang – Giám đốc công ty VIAMI).

DSC_1349

PGS.TS. Triệu Văn Cường, Hiệu trưởng trường Đại học Nội vụ Hà Nội chủ tọa buổi tọa đàm phát biểu khai mạc.

DSC_1353

TS Đoàn Thị Hòa, Phó trưởng khoa Khoa Văn thư-Lưu trữ, Trường Đại học Nội vụ Hà Nội phát biểu về nhu cầu đổi mới chương trình giảng dạy của nhà trường.

DSC_1351

Các đại biểu tới dự và lắng nghe ý kiến.

DSC_1358

PGS.TS Lê Đức Ngọc, Giám đốc trung tâm kiểm định, đo lường và đánh giá chất lượng giáo dục (CAMEEQ), thuộc hiệp hội các trường đại học, cao đẳng ngoài công lập Việt Nam (VIPUA), trình bày việc phát triển chương trình đào tạo theo cách tiếp cận chuẩn đầu ra.

DSC_1359

Đại diện cục Văn thư & Lưu trữ phát biểu vấn đề quản lý nhà nước về văn thư lưu trữ.

DSC_1360

Ông Nguyễn Phú Thành, đại diện Bộ KHCN phát biểu ý kiến về quản lý công tác Văn thư – lưu trữ.

DSC_1362

Ông Trần Quang Kỳ, Ban cơ yếu Chính phủ, Bộ QP trình bày vấn đề an ninh thông tin trong phát triển công nghệ lưu trữ.

DSC_1363

Ông Lê Ngọc Quang, Công ty Cổ phần Phần mềm VIAMI trình bày về phát triển công nghệ, ứng dụng giải pháp số hóa vào quản lý văn thư – lưu trữ.

DSC_1370

Và sự phát triển cũng như sự sẵn sàng trong công tác lưu trữ điện tử của Việt Nam.

DSC_1373

PGS.TS Dương Văn Khảm, Nguyên cục trưởng cục văn thư & lưu trữ nhà nước; chuyên gia thẩm định chương trình đào tạo góp ý về vấn đề phát triển chương trình.

 

 

Lịch sử các phương tiện lưu trữ ghi nhận từ thời sơ khai như các bức tranh vẽ trong hang động,…. Trong thời đại công nghệ hiện đại thì dưới đây là những phương tiện lưu trữ tốt nhất từ trước tới nay.

Băng từ – Magnetic tape

Băng từ là một phương tiện ghi âm bằng từ tính được làm bằng một lớp phủ magnetizable mỏng trải trên cuộn phim nhựa dài và mỏng. Các thiết bị, định dạng đã phát triển từ những năm 1950 đáng chú ý nhất là hệ thông Uniservo, định dạng reel-to-reel và băng cassette nhỏ gọn. Và đến nay, công nghệ này vẫn đang tiếp tục phát triển với loại băng từ có thể lưu trữ gần 200 TB dữ liệu của Sony. Băng từ đã được đưa vào phục vụ con người như một phương tiện đáng tin cậy, giá thành hợp lí cho việc lưu trữ dữ liệu của phần lớn các máy tính trong lịch sử trước đây.

Ảnh

Băng từ đặt dấu ấn trong lịch sử âm nhạc và hình ảnh.

Vào thế kỉ trước thì băng từ là một trong những trụ cột của ngành công nghệ và giải trí có mặt trong các thiết bị chơi nhạc cầm tay, video gia đình, giải pháp lưu trữ,.… Thậm chí các trò chơi đầu tiên của máy tính cá nhân 8 bit ZX Spectrum, Commodore 64, Atari đều xuất hiên trên băng từ. Nếu thiếu định dạng lưu trữ này thì thời đại thông tin đã có thể bị lùi lại vài thập kỉ.

Đĩa mềm 3,5 inch

Đĩa mềm 8 inch và 5,25 inch được phát triển vào thập niên 70 đã được ứng dụng vào trong các ngành đặc thù. Nhưng đến đầu nhưng năm 1980, đĩa mềm 3,5 inch ra đời đã đánh dấu một phương tiện lưu trữ bỏ túi hoàn hảo cho thị trường máy tính cá nhân đang phát triển. Đĩa mềm 3,5 inch dễ dàng trong lưu trữ, cung cấp một lượng không gian lưu trữ khá tốt. Thời điểm đó hầu hết mọi người chỉ lưu trữ tệp tin văn bản và các chương trình ứng dụng nhỏ. Còn lưu trữ nhạc hay video trên máy tính vào thời điểm này thì là một giấc mơi của người dùng.

Ảnh

Vào cuối thập niên 80, đĩa mềm 3,5 inch có dung lương 1,44 MB đã được tiêu chuẩn hóa, và đó là thiết bị lưu trữ di động chiếm ưu thế cho đến khi đĩa quang CD đã có giá cả phải chăng trong cuối thập niên 90. Mặc dù một số nỗ lực để thay đổi như đĩa Zip hay đĩa Jaz nhưng vẫn không thể cản lại bước tiến công nghệ.

Sony là hãng cung cấp đĩa mềm 3,5 inch lớn nhất thế giới. Năm 2008, công ty chiếm 40% thị phần trên cả thế giới, và 70% ở Nhật Bản. Doanh số đĩa mềm 3,5 inch đạt mức cao nhất vào năm 2000 với 47 triệu đĩa, tuy nhiên đến năm 2009 con số này chỉ còn 8,5 triệu.

Khi iMac đầu tiên được giới thiệu vào năm 1998 không được trang bị ổ đĩa mềm, Apple đã bị chế giễu bởi nhiều chuyên gia công nghệ cao vào thời điểm đó bởi vì đĩa mềm 3,5 inch đã rất phổ biến. Và nay lịch sử đã chứng minh Apple đã quyết định đúng khi từ bỏ đĩa mềm.

Đĩa compact

Hiện nay một số những người đam mê âm nhạc vẫn đang còn sử dụng khá nhiều dòng sản phẩm này, những chiếc đĩa quang này đã mang âm nhạc vào thời đại kĩ thuật số. Những chiếc đĩa CD nhạc đầu tiên được giới thiệu vào đầu năm 1980 nhưng phải đến những năm 1990 định dạng này mới bắt đầu thực sự cất cánh.

Tiện ích đầu tiên mà định dạng quang học mang lại cho người dùng là khả năng cũng như chất lượng âm thanh không bị suy giảm khi nghe lặp đi lặp lại nhiều lần hiệu quả hơn để thay thế băng cassette trong các máy nghe nhạc di động. Đĩa CD được xem như là một cuộc cách mạng trong lĩnh vực giải trí số nhất là thời điểm Sony quyết định sử dụng đĩa quang để thay thế băng từ, một trong những điểm nhấn đó là Final Fantasy VII.

Ảnh

Ngoài thành công trong việc chuyển đối thế giới âm nhạc kĩ thuật số, đĩa CD cũng cho phép người dùng dễ dàng lưu trữ và truy cập lượng dữ liệu lưu trữ khổng lồ với giá thành thấp. Ổ ghi đĩa CD bắt đầu bùng nổ vào cuối những năm 1990 đã đẩy đĩa mềm và đĩa Zip trở nên lỗi thời. Khả năng sao lưu với quy mô lớn đã trở nên thiết thực với người dùng bình dân. Các phương tiện lưu trữ đĩa quang này cũng tồn tại được thời gian khá dài và dần bị đẩy lùi bở các định dạng khá cao cấp hơn như thẻ nhớ flash giá rẻ. Mặc dù vậy đĩa quang là vẫn là một điểm nhất quan trọng trong lịch sử các thiết bị lưu trữ.

Thẻ SD- Secure Digital Card

Trong những năm 1990, một trong số những cạnh tranh về định dạng thẻ nhớ đươc đánh dấu bằng việc ra đời của 2 sản phẩm là CompactFlash và Memory Stick. Nhưng tại thời điểm này bởi giá thành khá cao nên cả 2 chuẩn thẻ nhớ này không được sử dụng rộng rãi.

Hiệp hội thẻ SD (SDA) được thành lập ngày 28/1/2000 bởi các tập đoàn Matsushita, Panasonic, SanDisk, Nintendo, Toshiba…. Và đến thời điểm hiện tại sau hơn 14 năm hoạt động thì thẻ SD đã trở thành một trong nhưng tiêu chuẩn lưu trữ.

Ảnh

Thẻ nhớ SD với thiết kế nhỏ gọn, dung lượng lớn và tốc độ cao đã trở thành phương tiện lưu trữ cho rất nhiều sản phẩm công nghệ tại thời điểm hiện tại. Có 4 dòng sản phẩm SD bao gồm : Hiệu suất tiêu chuẩn SDSC – Standard Capacity; Hiệu suất cao SDHC – High Capacity; Hiệu suất mở rộng SDXC – eXtended Capacity (SDXC); và loại thẻ kết hợp đầu vào/ ra dữ liệu SDIO.

Dòng sản phẩm SD còn được sử dụng rộng rãi trong điện tử tiêu dùng như điện thoại với tiêu chuẩn nhỏ gọn micro SD và có khả năng lưu trữ video 4k…

Ổ đĩa lai SSHD

Đĩa cứng HDD là một trong những phương tiện lưu trữ chi phối các thiết bị trong nhiều thập kỉ nay. Những chiếc đĩa cứng lưu trữ đầu tiên được ra năm vào thập niên 50 và phát triển mạnh mẽ cho đến hiện tại. SSD bắt đầu được sử dụng trong laptop mặc dù cho đến năm 2009, chi phí trên đơn vị lưu trữ của SSD vẫn đắt hơn HDD nhiều lần.

Ảnh

Và một định dạng mới ra đời là ổ đĩa lai SSD hay còn gọi là SSHD-solid-state hybrid drives. Bằng cách kết hợp giá thành thấp trên mỗi GB của HDD và tốc độ ấn tượng của SSD, định dạng SSHD đã nhanh chóng trở thành thiết bị lưu trữ di động cho người dùng tìm kiếm sự cân bằng hoàn hảo giữa chi phí và hiệu suấtt.

SSHD sử dụng các thuật toán “bộ đệm” (caching) do firmware của thiết bị điều khiển. Nó sẽ tính toán xem phần dữ liệu nào nên nằm trên phần flash và phần nào nằm trên các đĩa từ. Một Seagate SSHD dung lượng 1 TB lưu trữ truyền thống và 8 GB flash có giá khoảng 110 USD. Trong khi đó, một ổ cứng cung dung lượng nhưng định dạng SSD của Samsung có giá khoảng 450 USD.SSHD cũng cho một hiệu năng hoạt động tương đương đặc biệt là liên quan đến thời gian khở động. Vì thế SSD có thể là tương lai nhưng hiện tại là SSHD.

Theo PCworld

Trước kia người ta sử dụng một số thiết bị scan chuyên dụng và nhận dạng đánh dấu truyền thống dựa vào nguyên lý phản xạ ánh sáng (tại các vùng có đánh dấu/tô, ánh sáng sẽ phản xạ yếu hơn các vùng trống khác), với các thiết bị này, yêu cầu về việc đánh dấu, tạo mẫu, cũng như yêu cầu về chất liệu giấy in rất khắt khe.

Ngày nay, các phần mềm nhận dạng đánh dấu (Optical Mark Recognition – OMR) cho phép người dùng tự tạo các mẫu cũng như in chúng trên các chất liệu giấy thông thường. Phần mềm chỉ cần làm việc với ảnh quét của mẫu sau khi điền.

EZData-OMR-scannerng nghệ OMR đơn giản hơn rất nhiều so với công nghệ OCR hay ICR. Công nghệ OMR thường được dùng để xử lý dữ liệu từ các phiếu điều tra hay các bài thi trắc nghiệm.

Tham khảo thêm

adrt-illustrationADRT (Adaptive Document Recognition Technology) là một bước tiến lớn trong công nghệ nhận dạng tài liệu; là một phần quan trọng và chỉ có trong công nghệ OCR do ABBYY phát triển. ADRT được dùng để nhận dạng các cấu trúc logic, cách dàn trang cũng như các định dạng khác nhau trong tài liệu nhiều trang, ví dụ như: mục lục, đầu trang, chân trang, chú thích, chú thích bảng, chú thích ảnh, số trang v..v…

Khi kết quả nhận dạng được lưu dưới dạng Microsoft Word, các định dạng trên được nhìn nhận như những đối tượng tương ứng trong Word chứ không đơn thuần chỉ là các khối văn bản.

Để đạt được tính chính xác trong việc phân tích dàn trang, cấu trúc logic cũng như các định dạng trong tài liệu là do ADRT xem xét và xử lý các tài liệu nhiều trang như là một đối tượng tổng thể chứ không phải là tập hợp các trang riêng biệt. Với công nghệ ADRT, người dùng sẽ không mất, hoặc mất rất ít thời gian cho việc biên tập lại kết quả nhận dạng.

image004Công nghệ “nhận dạng ký tự thông minh” hay còn gọi là “nhận dạng chữ viết tay” (ICR) là bản dịch từ các ký tự viết tay sang dạng văn bản với ký tự mà máy tính có thể đọc được. Công nghệ ICR là sự phát triển ở mức cao hơn từ công nghệ nhận dạng chữ in (OCR). Đối tượng nhận dạng của công nghệ ICR là chữ viết tay và cả chữ in. Công nghệ ICR tương tự như nhận dạng ký tự quang học (OCR ) và đôi khi sử dụng kết hợp với OCR trong hình thức xử lý.

Công nghệ nhận dạng chữ viết tay thường được sử dụng trong việc nhận dạng thông tin từ các tài liệu dạng biểu mẫu. Trên các tài liệu dạng này, một số thông tin được điền bằng tay tại các vị trí cố định (tờ khai, phiếu đăng ký, bài kiểm tra, v..v…).

Trước khi có công nghệ ICR và OCR, thường người ta khai thác bằng cách nhập dữ liệu lại từ bản giấy sang format điện tử trên máy tính, với dạng tương tự như ở mẫu giấy. Dữ liệu lấy từ các mẫu giấy tờ bao gồm chữ đánh máy hoặc in qua trình soạn thảo, chữ viết tay, đánh dấu tích, mã vạch và chữ ký. Ngày nay, người ta xử lý bằng máy quét, máy chụp ảnh, kết hợp với công nghệ OCR và ICR, và các phần mềm xử lý form để tự động hóa quá trình này trong khoảnh khắc với độ chính xác lên tới 98%, gần tương đương với việc nhập liệu bằng tay.

Tham khảo thêm:

– Principals of Intelligent Character Recognition

Ứng dụng trong điều tra thống kê

 

FreeOCR-netNhận dạng ký tự quang học (tiếng AnhOptical Character Recognition, viết tắt là OCR), là loại phần mềm máy tính được tạo ra để chuyển các hình ảnh của chữ viết tay hoặc chữ đánh máy (thường được quét bằng máy scanner) thành các văn bản tài liệu. OCR được hình thành từ một lĩnh vực nghiên cứu vềnhận dạng mẫutrí tuệ nhận tạo và machine vision. Mặc dù công việc nghiên cứu học thuật vẫn tiếp tục, một phần công việc của OCR đã chuyển sang ứng dụng trong thực tế với các kỹ thuật đã được chứng minh.

Nhận dạng ký tự quang học (dùng các kỹ thuật quang học chẳng hạn như gương và ống kính) và nhận dạng ký tự số (sử dụng máy quét và các thuật toán máy tính) lúc đầu được xem xét như hai lĩnh vực khác nhau. Bởi vì chỉ có rất ít các ứng dụng tồn tại với các kỹ thuật quang học thực sự, bởi vậy thuật ngữNhận dạng ký tự quang học được mở rộng và bao gồm luôn ý nghĩa nhận dạng ký tự số.

Đầu tiên hệ thống nhận dạng yêu cầu phải được huấn luyện với các mẫu của các ký tự cụ thể. Các hệ thống “thông minh” với độ chính xác nhận dạng cao đối với hầu hết các phông chữ hiện nay đã trở nên phổ biến. Một số hệ thống còn có khả năng tái tạo lại các định dạng của tài liệu gần giống với bản gốc bao gồm: hình ảnh, các cột, bảng biểu, các thành phần không phải là văn bản

Hiện nay, với chữ Việt, phần mềm nhận dạng chữ Việt in VnDOCR 4.0 có khả năng nhận dạng trực tiếp các loại tài liệu được quét qua máy quét, không cần lưu trữ dưới dạng tệp ảnh trung gian. Các trang tài liệu có thể được quét và lưu trữ dưới dạng tệp tin nhiều trang. Kết quả nhận dạng được lưu trữ sang định dạng của Microsoft Word, Excel… phục vụ rất tốt nhu cầu số hóa dữ liệu.

Ngoài ra, còn có một dự án OCR Tiếng Việt có tên VietOCR, được phát triển dựa trên nền tảng mã nguồn mở tesseract-ocr do Google tài trợ. VietOCR có khả năng nhận dạng chữ Việt rất tốt. Đây là một chương trình nguồn mở Java/.NET, hỗ trợ nhận dạng cho các dạng ảnh PDF, TIFF, JPEG, GIF, PNG, và BMP.

ABBYY – một hãng công nghệ hàng đầu trên thế giới về lĩnh vực Nhận dạng ký tự quang học đã tiến hành nghiên cứu và triển khai công nghệ nhận dạng Tiếng Việt vào tháng 4 năm 2009. Với công nghệ này độ chính xác trong việc nhận dạng tài liệu chữ in Tiếng Việt lên tới hơn 99% (cứ nhận dạng 100 ký tự thì có chưa đến 1 ký tự sai). Công nghệ của ABBYY chấp nhận hầu hết các định dạng ảnh đầu vào như: PDF, TIFF, JPEG, GIF, PNG, BMP, PCX, DCX, DjVu… Kết quả nhận dạng được lưu trữ dưới các định dạng MS Word, MS Excel, HTML, TXT, XML, PDF, PDF 2 lớp, trong đó định dạng PDF 2 lớp là một định dạng hoàn hảo cho việc lưu trữ và khai thác tài liệu. Với định dạng này, người đọc có thể đọc trung thực ảnh gốc nhờ lớp ảnh bên trên, các công cụ tìm kiếm có thể tìm kiểm toàn văn trên văn bản nhờ lớp text nhận dạng được bên dưới.

Trạng thái hiện thời của công nghệ OCR

Sự nhận dạng chính xác ký tự Latin đánh máy được xem là vấn đề đã được giải quyết. Tỷ lệ chính xác thực tế đạt tới 99%, mặc dù một số ứng dụng đòi hỏi tỷ lệ chính xác cao hơn nữa cần phải con người kiểm tra lại lỗi.

Việc nhận dạng chữ in bằng tay, chữ thảo bằng tay, và thậm chí những phiên bản đánh máy được in ra của vài chữ (đặc biệt là những chữ có số chữ cái lớn), vẫn còn là một đề tài của các nghiên cứu.

Các hệ thống nhận dạng ký tự viết tay đã đạt được những thành công lớn về mặt thương mại trong những năm gần đây. Trong số đó là thiết bị nhập cho những thiết bị hỗ trợ cá nhân (PDA) như những phần mềm chạy trên Palm OS. hãng Apple Newton đi tiên phong trong công nghệ này. Những giải thuật sử dụng trong những thiết bị này sử dụng những ưu điểm rằng thứ tự, tốc độ, và hướng của những đoạn dòng đơn lẻ đã được biết trước. Tương tự, người dùng có thể được yêu cầu sử dụng chỉ một vài loại kiểu chữ nhất định. Những phương pháp này không thể dùng được trong phần mềm scan tài liệu giấy, do đó sự nhận dạng chính xác văn bản in bằng tay vẫn là một vấn đề lớn đang được bỏ ngỏ. Với mức chính xác từ 80% đến 90%, những ký tự in bằng tay sạch sẽ có thể được nhận ra, nhưng độ chính xác đó vẫn tạo ra hàng tá lỗi mỗi trang, khiến cho công nghệ đó chỉ hiệu quả trong vài trường hợp nào đó. Sự đa dạng của OCR hiện nay được biết đến trong công nghiệp là ICR, (Intelligent Character Recognition – Nhận dạng Ký tự Thông minh).

Nhận dạng chữ viết tay là một lĩnh vực nghiên cứu sôi nổi, với tỷ lệ nhận dạng thậm chí còn thấp hơn cả văn bản in bằng tay. Tỷ lệ nhận dạng cao hơn của những bản viết tay chung chung hầu như là không thể nếu không sử dụng thông tin về ngữ pháp và văn cảnh. Ví dụ như, nhận dạng cả một chữ từ một cuốn từ điển thì dễ hơn là việc cố gắng lấy ra những ký tự rời rạc từ đoạn đó. Đọc dòng Tổng cộng của một tờ séc (luôn luôn được viết bằng số) là một ví dụ trong đó sử dụng những từ điển nhỏ hơn có thể tăng tỷ lệ nhận dạng rất nhiều. Kiến thức về ngữ pháp của một ngôn ngữ được scan cũng có thể giúp xác định một từ có thể là động từ hay danh từ, ví dụ như vậy, sẽ cho phép độ chính xác cao hơn. Hình dạng của chữ viết tay bản thân nó đã không chứa đủ thông tin về để nhận dạng chính xác (hơn 98%) tất cả những đoạn chữ viết tay.

Một vấn đề khó khăn của máy tính và con người đó là những bản lưu của những lễ thánh và đám cưới của những nhà thờ cũ chỉ toàn chứa tên. Những trang đó có thể bị hư hại do thời gian, nước hay lửa và những tên trên đó có thể đã lỗi thời hoặc chứa những chính tả hiếm gặp. Lĩnh vực nghiên cứu khác là tiếp cận hợp tác, ở đó máy tính hỗ trợ con người và ngược lại. Kỹ thuật xử lý hình ảnh của máy tính có thể hỗ trợ con người trong việc đọc những văn bản cực kỳ khó đọc như Bản viết trên da cừu của Archimede hay những Cuộn giấy da lấy từ vùng Biển Chết.

Tóm lại, đối với những vấn đề nhận dạng phức tạp hơn mạng nơ-ron được sử dụng rộng rãi bởi chúng có thể làm làm đơn giản hóa cả biến đổi affine lẫn biến đổi phi tuyến.[1]

Nguồn Wikipedia