NGHIA's Computer Studies

[if !mso]>

 

NHN DNG KÝ T VIT T TP TIN NH

 

VÕ HIẾU NGHĨA

 

 

Khi bạn có một tài liệu từ báo chí, sách vở cần trích ra riêng cho mình, giúp cho công việc tham khảo của bạn, thí dụ để làm giáo án, giáo trình, viết sách, viết truyện, trích  thơ…. Tóm lại từ một ảnh chụp trang sách báo, bạn có thể chuyển ra dạng văn bản để sử dụng nó.

Việc nhận dạng này rất là hữu ích.

 

Tuy ở đây ta nhấn mạnh về tiếng Việt, nhưng bạn cũng vẫn có thể áp dụng cho các tiếng nước ngoài khác, như Anh, Pháp, Nga, Tây Ban Nha, Ý…

        Tất nhiên trước hết các bạn sẽ phải SCAN chúng ra để tạo thành các tập tin ảnh, thông dụng nhất là *.JPG.

 

        Vào trang Web : http://www.newocr.com/

        Chương trình này có thể nhận dạng đến 29 ngôn ngữ (29 languages) : Bulgarian, Catalan, Czech, Danish, Dutch, English, Finnish, French, German, Greek, Hungarian, Indonesian, Italian, Latvian, Lithuanian, Norwegian, Polish, Portuguese, Romanian, Russian, Serbian, Slovak, Slovene, Spanish, Swedish, Tagalog, Turkish, Ukrainian, Vietnamese.

          Rất nhiều dạng tập tin ảnh được dùng để nhận dạng như JPEG (JPG), PNG, GIF, BMP, nhiều trang TIFF) có dung lượng đến 5 MB

        Các tài liệu nhiều trang như  PDF có dung lượng đến 20 MB

        Kết quả là bạn sẽ nhận được một tập tin dạng TXT hoặc dạng DOC của Word.

 

 

 Trên đây là trang Web mà bạn sẽ làm việc trực tiếp trên đó mà không cần đăng ký.

 

1/ Kích nút [BROWSE] và chỉ đường dẫn đến tập tin ảnh cần nhận dạng.

2/ Chọn ngôn ngữ cần nhận dạng ở mục [Language of the document], mặc định là [English],

Kích nút mũi tên và chọn, thí dụ, [Vietnamese].

3/ Nếu tập tin ảnh nằm dọc, bạn có thể chọn [Rotate document], nếu không, cứ để không thay đổi [No change].

4/ Kích nút [SEND FILE] để chương trình nhận dạng.

5/ Cửa sổ nhận dạng xuất hiện, ở khung phải và bên trái cửa sổ có 2 lựa chọn : DOC (của Word) hay TXT (của Notepad) + kích chọn một (thí dụ DOC).

6/ Chương trình sẽ download giúp bạn và hiển thị trong thư mục download quen thuộc của bạn, thường là C:\Documents and Settings\ Administrator \My Documents\Downloads\ và dưới tên là newocr-20091215124430.doc. Bạn có thể đổi tên lại.

7/ Nếu thấy việc nhận dạng chưa thoả mản, bấm nút [Repeat Recognition].  Nếu muốn làm việc tiếp, tức là thực hiện tiếp một cuộc nhận dạng mới, bấm chọn [UPLOAD NEW FILE].

 

        Xem phần thô đã nhận dạng ở cuối trang Web

        Dưới đây là một lần nhận dạng từ một trang SCAN của chúng tôi, đã đổi qua dạng .DOC hiện trong Word.  Chúng tôi vẫn giữ nguyên bài nhận dạng của chương trình và không hề thực hiện chữa lỗi nào cả. “

1000 năm Thăng Long

“ (Họa thơ của Thầy Hàm, nhà thơ Ngũ Hà Miên) 

Canh Dần đến lễ gặp Rồng Bay,

Thế sự thăng trầm biến đổi tüy.

Nhớ tới Thành Loa rùa móng cũ,

Thuong về Hà Nội cá kình nay.

Vung gươm giết Sạch loài lang Sói,

Động thổ chôn Vùi giặc Bắc Tây.

Nửa tấc giang Sơn không để mất,

Công dàn niinh trí chữa vui vầy.

  NÌNLãm (SG2009)

Chủ thích của tác giả : g

- Rùa móng cũ Z Theo huyền thoại Linh Quang Trảo Thần Nó

- Cá kình : Chỉ nước lỏn

Nhân kỉ niệm ngày Nhà Giáo ViệtNam 2OẮ1_1, xỉn tặng“quý bạn bài thơ

tâm sự nói lên nỗi lòng nhà giáo hưu tri. `   _

    NỖI LÒNG

Hơn 40 năm làm thầy dạy học,

Những ngày vui khổ nhọc đã qua.

Giờ đây ,an phận tuổi già,

Thân còm, tóc bạc, mắt hoa, lưng còng..

Bấy lâu được lúc thong dong,

Sống trong thanh bạch còn mong ước gì.

Gió chiều thoang thoáng qua mi, “ 0 .

Ngỡ trong lau lách chân đi ngàn trùng.

Thẩn thơ, mông quạnh, lạnh lùng,

Cố nhân, cố quận, chập chùng Xa khơi.

sự đời như tỉnhẹ? như mơ,

Giấc chiêm bao ấy bây giờ của ta.

H Ợ\ÃNLãm - Ký Sửu niên đông)    

Free Online OCR http://www.newocr.com

 

NHẬN XÉT : Việc nhận dạng chữ của chương trình này đạt đến hơn 90% mức chiùnh xác. Hơn tất cả các chương đã có từ trước.

Tập tin ảnh gốc đã được SCAN, xin xem ở trang sau.



 

 
Make a Free Website with Yola.