• vi-VNen-GB
Thông cáo báo chí
HỌP BÁO CÔNG BỐ BÁO CÁO TÌNH HÌNH CHÍNH TẢ VĂN BẢN TIẾNG VIỆT
(02/11/2011)

THÔNG CÁO BÁO CHÍ

HỌP BÁO CÔNG BỐ BÁO CÁO TÌNH HÌNH CHÍNH TẢ VĂN BẢN TIẾNG VIỆT

Ngày 28/7/2010, tại Hà Nội, Viện Công nghệ Thông tin – Đại học Quốc Gia HN, Công ty CP Truyền thông và Công nghệ VieGrid phối hợp cùng với Báo Điện tử VietNamNet tổ chức buổi họp báo công bố Báo cáo Tình hình Chính tả Văn bản tiếng Việt.

Trong giai đoạn phát triển hiện nay, xã hội Việt Nam đang phải đối diện với rất nhiều thách thức mới. Ngôn ngữ là tài sản văn hóa quý giá và gắn liền với lịch sử phát triển của mỗi dân tộc. Gìn giữ sự trong sáng và làm cho tiếng Việt ngày càng phong phú, giàu đẹp hơn luôn là việc làm cần thiết của mỗi con người chúng ta.

Với mong muốn cộng đồng Việt Nam, nhất là thế hệ trẻ, sẽ cùng chung sức gìn giữ và bảo vệ Ngôn ngữ Việt, Viện Công nghệ Thông tin - Đại học Quốc Gia HN, phối hợp với Công ty CP Truyền thông và Công nghệ VIEGRID; đã tiến hành điều tra, nghiên cứu khoa học và đánh giá về chất lượng về chính tả văn bản tiếng Việt với lời kêu gọi thiết tha “Hãy cùng chúng tôi giữ gìn tiếng Việt”.

Tổng Giám Đốc Công ty CP Truyền thông và Công nghệ VIEGRID – Bà Lê Ngọc Hồng chia sẻ: “Chúng tôi luôn muốn đóng góp và chia sẻ cho cộng đồng bằng những hành động thiết thực và ý nghĩa. Từ nhiều năm nay chúng tôi đã phát triển các phần mềm xử lý tiếng Việt. Do đó, cùng với Viện CNTT và các Nhà ngôn ngữ học, chúng tôi xây dựng bản Báo cáo này để gióng tiếng chuông đầu tiên để đốt lên ngọn đuốc nhiệt huyết, tuyên chiến mạnh mẽ với nạn lỗi chính tả tràn lan hiện nay trong tiếng Việt”

Báo Điện tử Vietnamnet hy vọng sẽ là một trong những cơ quan báo chí đầu tiên đi đầu chiến dịch cộng đồng này, nghiêm túc nhìn nhận vấn đề chính tả và cùng với xã hội gìn giữ tiếng Việt.

Trước khi đánh giá chất lượng chính tả văn bản tiếng Việt, nhóm tác giả đã tiến hành một cuộc điều tra nhỏ trong hai nhóm Chuyên gia ngôn ngữ và Chuyên gia CNTT: Nhóm chuyên gia ngôn ngữ yêu cầu tỷ lệ lỗi chính tả trong văn bản Việt phải là dưới 1%. Nhóm chuyên gia CNTT chấp nhận tỷ lệ này trong khoảng 2,5-5%. Cả hai nhóm chuyên gia đều nhất trí cho rằng báo chí và truyền thông có trách nhiệm nhiều nhất đối với tình hình chính tả tiếng Việt. Tuyệt đại đa số các chuyên gia cũng cho rằng tỷ lệ 10% là ngưỡng báo động đối với các lỗi chính tả và 30% là ngưỡng mà một lỗi chính tả đã trở thành một cách viết có thể đồng thời được chấp nhận.

Trong đợt xếp hạng tháng 6/2010 đã đánh giá 177 đơn vị và xếp hạng 132 đơn vị trong 7 khu vực (theo trang web xephangvanban.com)

1) Bộ và Văn phòng Trung ương;

2) Ủy ban nhân dân Tỉnh và Thành phố trực thuộc Trung ương;

3) Cơ quan thuộc Chính phủ và thuộc Bộ;

4) Đại học và Viện nghiên cứu;

5) Báo chí, nhà xuất bản và cơ quan truyền thông;

6) Doanh nghiệp Việt nam;

7) Tổ chức và doanh nghiệp nước ngoài tại Việt nam.

Nhóm Tác giả đã thống kê trên 67.000 mẫu. Lựa chọn phương pháp thống kê, với tập lỗi điển hình, là phương pháp phù hợp với điều kiện hạn chế về nguồn lực. Với 67.000 mẫu thống kê, tỷ lệ lỗi chính tả trung bình của văn bản tiếng Việt là 7.79%, cao hơn nhiều so với mức yêu cầu tối thiểu.

Tỷ lệ lỗi chính tả cao nhất như sau: “soi mói” 74,33%,  “sáng lạn” 41,66%, “cọ sát” 28,38% và “thăm quan” 20,61%.

Khu vực báo chí và truyền thông có tỷ lệ lỗi chính tả cao nhất, gần mức báo động 10%.

Khu vực Đại học và Viện nghiên cứu có tỷ lệ lỗi xấp xỉ mức trung bình của xã hội, chưa phát huy được sự mẫu mực và tiên phong trong vấn đề dùng chữ nghĩa.

Đặc biệt, cả hai khu vực này đều có các đại diện có tỷ lệ lỗi vượt mức 30%.

Khu vực chính quyền địa phương, và các cơ quan thuộc chính phủ, thuộc Bộ có tỷ lệ lỗi chính tả khá cao. Đặc biệt, có đơn vị có tỷ lệ lỗi gần 40%.

Ngay cả các khu vực khá nhất là doanh nghiệp và các Bộ vẫn còn phải tiếp tục cải thiện chất lượng để có thể đạt được mức 1%.

Các kết quả đánh giá chi tiết được công bố trên trang Web www.xephangvanban.com

Kết quả nói trên đã phản ánh tình hình báo động của chính tả tiếng Việt. Nhóm Tác giả  mong muốn cố gắng giúp toàn thể xã hội và các đơn vị được xếp hạng bước đầu nhận thức được tầm quan trọng của vấn đề chính tả tiếng Việt. Các đợt đánh giá tiếp sau sẽ được tiến hành 3 tháng một lần và sẽ liên tục được mở rộng về quy mô để hậu thuẫn cho một chiến dịch cộng đồng về quét lỗi chính tả.

Việc giới thiệu các sản phẩm soát lỗi chính tả tiếng Việt một cách khách quan trong bản đánh giá xephangvanban sẽ là cần thiết cho chiến dịch quét lỗi chính tả. Dựa trên một phân tích thống kê, nhóm tác giả đã ước lượng được tỷ lệ giữa lỗi phi từ và lỗi thực từ là 31.69%: 68.31%. Trái với quan niệm của một số chuyên gia CNTT, khác với trong tiếng Anh, lỗi thực từ chiếm đa số trong tiếng Việt. Điều đó có thể giải thích tại sao, các sản phẩm không có khả năng quét lỗi thực từ đã không nhận được hưởng ứng mạnh mẽ từ phía người dùng.

Để đánh giá khách quan, nhóm tác giả đã đề nghị sử dụng các độ đo như độ nhận biết, độ chính xác và khả năng gợi ý để đánh giá hiệu năng cho các phần mềm soát lỗi. Nhóm chuyên gia cũng đưa ra độ đo VIE: độ đo cân bằng giữa các yếu tố nói trên và tỷ lệ với tần số xuất hiện các lỗi phi từ và lỗi từ thực.

Trong tương lai, các doanh nghiệp, chuyên gia và người sử dụng có thể tiếp tục giới thiệu các sản phẩm mới giúp ích cho chính tả tiếng Việt với cộng đồng trên trang Web ww.xephangvanban.com.

Các nỗ lực đơn độc dù cố gắng đến đâu cũng không mang lại kết quả như mong muốn. Với công trình này, nhóm tác giả hy vọng sẽ có các nhà quản lý, chuyên gia ngôn ngữ và các nhà văn hóa sẽ vào cuộc để chủ trương cho chiến dịch này.  Đồng thời có nhiều bạn đồng nghiệp trong lĩnh vực CNTT sẽ cho ra nhiều sản phẩm để cùng giúp ích cho cộng đồng. HÃY CÙNG CHÚNG TÔI GIỮ GÌN TIẾNG VIỆT.

Trân trọng cảm ơn.