Cơ hội mới cho báo chí trong kỷ nguyên Big Data

04/06/2018, 17:23

Cơ hội mới cho báo chí trong kỷ nguyên Big Data - Trong thời đại công nghệ thông tin, tài nguyên của mỗi quốc gia không còn là khoáng sản mà chính là dữ liệu.

Thời đại của dữ liệu sẽ còn rất dài nữa? Ảnh: TL

Thời đại của dữ liệu

Hiện nay, số người truy cập Internet vào khoảng 48,2% dân số thế giới, khoảng 3,88 tỷ người dùng Internet, hơn 1,9 tỷ website, 138 tỷ email, 3,8 tỷ lượt xem video trên YouTube, 2,2 tỷ người truy cập Facebook, 3,5 tỷ lượt tìm kiếm trên Google cùng vô vàn thông tin được tạo ra mỗi ngày(1) ... tạo ra khối lượng rất lớn dữ liệu, tham gia vào dòng chảy thông tin trong kỷ nguyên số. Mỗi ngày, con người tạo ra khoảng 2,5 x 1018 byte dữ liệu và 90% dữ liệu trên thế giới ngày nay được tạo ra chỉ trong 2 năm qua. Sự tăng tốc trong việc sản sinh thông tin đã tạo ra nhu cầu cần có các công nghệ mới để phân tích các tập dữ liệu. Vậy làm thế nào để có thể thống kê, xử lý một tập hợp dữ liệu khổng lồ và phức tạp mà các hoạt động xử lý dữ liệu truyền thống không thể thực hiện được?

Dữ liệu lớn, đó là một thuật ngữ rộng mô tả “hoạt động thu thập, phân tích, giám sát dữ liệu, tìm kiếm, chia sẻ, lưu trữ, truyền nhận, trực quan hóa, truy vấn và tính riêng tư”(2) . Có thể hình dung, dữ liệu lớn là tập hợp khổng lồ khối dữ liệu từ hàng tỷ các thiết bị kết nối Internet với nhau. Trong thời đại phát triển IoT (Internet vạn vật) các thiết bị như máy tính, điện thoại, máy tính bảng, thiết bị thông minh trong nhà kết nối Internet, những cảm biến nhúng trong các hệ thống lớn như giao thông đô thị, đèn giao thông, và cơ sở hạ tầng,... sẽ tạo ra khối dữ liệu khổng lồ như file ghi nhật ký, tin nhắn, video kỹ thuật số, hình ảnh, dữ liệu,... Cùng với rất nhiều nguồn dữ liệu khác chính là các nội dung kỹ thuật số mà công chúng từ Internet như: nhạc, truyện, phim ảnh, các phần mềm (application), game... đều là nguồn dữ liệu của dữ liệu lớn.

Có thể hình dung lợi ích vô cùng to lớn mà Big Data mang lại, nếu như con người có thể tập hợp, phân tích, tìm mối liên hệ giữa vô vàn dòng chảy thông tin, có thể trích xuất những giá trị mới từ tư liệu, thậm chí từ đây có thể đưa ra những dự đoán, quyết định đúng đắn hơn, chắc chắn rằng mọi tổ chức và cá nhân khác nhau đều có thể đưa ra những quyết định tốt hơn, có thể đưa đến kết quả hoạt động tốt hơn như giảm chi phí và rủi ro.

Dữ liệu lớn (Big Data) tạo ra những cơ hội mới cho báo chí. Ảnh: TL

Mô hình “5 Vs” và những cơ hội mới cho báo chí

Năm 2014, Gartner (3) đã đưa ra mô hình “5 Vs” mô tả 5 đặc tính quan trọng của dữ liệu lớn (Big Data), đó cũng là những cơ hội mà lĩnh vực báo chí truyền thông có thể tiếp cận:

Dung lượng thông tin (Volume):

Dữ liệu lớn là tập hợp dữ liệu có dung lượng lưu trữ vượt quá khả năng xử lý của những ứng dụng và công cụ truyền thống. Điều này cho phép báo chí truyền thông có thể tiếp cận với một lượng khổng lồ các thông tin lưu trữ, có thể hệ thống dữ liệu đó một cách khoa học, tìm kiếm dữ liệu một cách dễ dàng hơn.

Việc sử dụng những khối lượng thông tin khổng lồ dẫn đến sự thay đổi sâu sắc trong cách báo chí tiếp cận dữ liệu. Thay vì, chỉ có thể khai thác, bóc tách những nét chính tiêu biểu về một vấn đề cụ thể, chỉ lấy những con số hay vấn đề trọng tâm đơn lẻ, các công cụ phân tích cho phép người làm báo có thể thu thập và sử dụng nhiều dữ liệu hơn, cùng lúc xử lý khối lượng “thông tin đầu vào” lớn hơn. Việc sử dụng một lượng khổng lồ những dữ liệu rất khác nhau đem lại nhiều ích lợi hơn là việc người làm báo phải cố gắng sàng lọc những dữ liệu tuy chính xác nhưng quá ít ỏi về dung lượng.

Tốc độ xử lý (Velocity):

Sự gia tăng dung lượng của dữ liệu kéo theo tốc độ xử lý dữ liệu. Dữ liệu lớn cho phép xử lý dữ liệu tức thì trước khi chúng được lưu trữ vào cơ sở dữ liệu. Nhờ vào sự phát triển của công nghệ xử lý dữ liệu, người làm báo có thể dễ dàng hơn khi xâm nhập sự kiện, nhanh chóng tìm kiếm, phân tích bản chất dữ liệu từ nhiều hướng, đẩy cao hơn nữa tốc độ thông tin, lượng thông tin, đảm bảo tính thời sự và tạo ra sự thuận tiện cho độc giả.

Dữ liệu lớn hỗ trợ cho người làm báo và cơ quan báo chí điều chỉnh thông điệp và cách truyền thông điệp phù hợp nhất, đưa ra những khuyến cáo trong thời gian thực. Từ đó, cơ quan báo chí có thể tương tác, truyền tải thông điệp, và thiết kế đúng giá trị phù hợp cho đối tượng công chúng khán giả vào đúng thời điểm quan trọng với họ để làm tăng giá trị, nâng cao sự hài lòng và trung thành của họ. Tốc độ xử lý dữ liệu giúp cho cơ quan báo chí có thể nhanh chóng đưa ra được dự báo về xu hướng phát triển của dòng chảy thông tin, về mối quan tâm của công chúng đối với từng sản phẩm truyền thông. Quan sát hành vi tiếp cận, truy cập của mỗi cá nhân độc giả sẽ giúp cơ quan báo chí có thể cải thiện được chất lượng sản phẩm tin bài. Nhờ có năng lực xử lý nội dung thông tin ở cấp độ cao, cơ quan báo chí sẽ có cơ hội phát triển mới, khi không chỉ sản xuất ra một sản phẩm duy nhất dành cho đại chúng, mà có thể sáng tạo những nội dung mới đáp ứng nhu cầu rất riêng biệt của từng cá nhân.

Trong kỷ nguyên của dữ liệu lớn, các sản phẩm báo chí dữ liệu sẽ càng phát triển đa dạng. Ảnh: TL

Sự đa dạng của dữ liệu (Variety):

Nếu như Báo chí dữ liệu (Data Journalism) là lĩnh vực báo chí được nhắc đến nhiều trong hơn một thập niên trở lại đây, trong kỷ nguyên của dữ liệu lớn, các sản phẩm báo chí dữ liệu sẽ càng phát triển đa dạng. Việc đưa tin với sự hỗ trợ của máy tính đã được sử dụng nhằm phân tích bản chất của các dữ liệu, của từng con số để kể lại câu chuyện một cách tốt nhất có thể.

Một ứng dụng điển hình là đối với các báo điện tử, ứng dụng dữ liệu lớn giúp cho việc sàng lọc, phân tích các dữ liệu về thói quen truy cập của độc giả từ khối lượng dữ liệu khổng lồ thu thập được qua Internet và chuyển đổi thành thông tin đánh giá về độc giả lưu trữ trong hệ thống của cơ quan báo chí. Những hiểu biết này giúp cho cơ quan báo chí đưa ra hình thức, mô hình, chiến lược thông tin phù hợp với từng nhóm công chúng cụ thể; đó cũng là cơ sở giúp họ tạo ra lợi thế cạnh tranh thu hút doanh thu quảng cáo khi hướng được tới đối tượng cụ thể.

Tính chính xác của dữ liệu (Veracity):

Nhà báo hay các cơ quan thông tấn, báo chí có nhiệm vụ “gác cổng”, một mặt phản ánh đầy đủ, chính xác và chân thật những câu chuyện xảy ra trong đời sống kinh tế, chính trị, văn hóa, xã hội,... mặt khác, cần phải cân nhắc lựa chọn chủ đề thông tin. Công chúng lâu nay đặt niềm tin vào báo chí và các kênh truyền hình chính thống.

Một trong những tính chất phức tạp nhất của dữ liệu lớn và cũng là cơ hội cho hoạt động báo chí, đó là độ chính xác của dữ liệu. Dữ liệu lớn thực hiện phân tích loại bỏ dữ liệu thiếu chính xác và dữ liệu “nhiễu”, trích xuất thông tin mang tính chính xác cao. Trên thực tế, báo chí là một “ngành kinh doanh đặc biệt dựa trên niềm tin”, vì vậy, nếu thông tin sai sự thật, làm mất niềm tin của độc giả, báo chí sẽ không còn “đất sống” (4) .

Trong xu thế toàn cầu hóa và Internet vạn vật, báo chí sẽ phải gắn liền với dữ liệu lớn như một xu thế tất yếu, vì bằng cách này, báo chí mới biết một cách chính xác và cụ thể công chúng khán giả đang nghĩ gì và cần gì, điều mà những cách thức thu thập thông tin truyền thống lâu nay (bằng bảng câu hỏi, phiếu thăm dò) không còn đáp ứng được trong bối cảnh hiện nay.

Giá trị của dữ liệu (Value)

Giá trị thông tin là tính chất quan trọng nhất của xu hướng công nghệ dữ liệu lớn, do vậy, phải xác định được giá trị mà thông tin mang lại để áp dụng cho hoạt động báo chí.

Phân tích dữ liệu lớn từ các khối dữ liệu có dung lượng và từ nhiều định dạng khác nhau để tìm ra các dạng thức ẩn chứa (hidden patterns), các mối tương quan chưa được biết đến (unknown correlations) và các nhận biết mới về thế giới. Khi “ghép nối” các mảng dữ liệu khổng lồ, dường như không mấy liên quan đến nhau, và phát hiện ra những điều bất ngờ. Thay vì chỉ phản ánh thông tin về hiện tượng (Ai, Cái gì, Ở đâu?) và lý giải căn nguyên “Như thế nào?” và “Tại sao?”, dữ liệu lớn hướng giúp người làm báo khám phá các mối tương quan và nguyên nhân của vấn đề, tìm sự trùng hợp đưa ra dự báo tiếp diễn “Điều gì sẽ xảy ra?” (5) .

Dữ liệu lớn đã tạo ra phong trào “dữ liệu mở”. Ảnh: TL

Thay lời kết

Dữ liệu lớn cũng có thể giúp tăng mức độ minh bạch và dân chủ của môi trường báo chí truyền thông. Trên thế giới đang có một phong trào dần lớn mạnh, xoay quanh ý tưởng “dữ liệu mở”, đi xa hơn cả những quy định pháp lý về tự do thông tin mà ngày nay đã trở nên phổ biến ở các nước dân chủ phát triển.

Tuy nhiên, trong một thế giới mà các vấn đề ngày càng được định đoạt bởi dữ liệu và công cụ máy móc, sự sáng tạo của báo chí, yếu tố khác biệt đa dạng của sản phẩm báo chí, phong cách khác biệt của người làm báo có bị bó hẹp hay không? Mục tiêu và sứ mệnh của báo chí truyền thông trong thời đại số có điều gì đáng bàn, khi mà tất cả mọi người ai cũng giống nhau, đều bị quyến rũ bởi sức mạnh của dữ liệu và những công cụ khai thác, những yếu tố rất quan trọng của nghề báo như trực quan, tư duy thực tiễn, thậm chí kể cả những cơ hội, duyên may... có bị xâm lấn bởi dữ liệu và những câu hỏi do máy móc cung cấp hay không? Còn rất nhiều vấn đề đang đặt ra ở phía trước.

TS Bùi Chí Trung

Bài viết được thực hiện trong khuôn khổ đề tài KHCN-TB.14X/13- 18 do Đại học Quốc gia Hà Nội tài trợ

--
(1) Số liệu thống kê trực tuyến của World Wide Web Consortium (W3C) và Web Foundation, đăng tải tại http://www.internetlivestats.com/inter net-users/
(2) Viktor Mayer - SchÖnberger & Kenneth Cukier, 2017. Big Data - Dữ liệu lớn. Nxb Trẻ, Tp Hồ Chí Minh, tr.17 - 30.
(3) Gartner, Inc. (NYSE: IT) - công ty nghiên cứu và tư vấn hàng đầu thế giới có trụ trở tại Hoa Kỳ.
(4) Ý kiến của nhà báo Lê Quốc Minh - Phó TGĐ Thông tấn xã Việt Nam.
(5) Kenneth Neil Cukier and Viktor Mayer-Schoenberger, The Rise of Big Data, How It’s Changing the Way We Think About the World, Foreign Affairs, May/June 2013, http://www.foreignaffairs.com/articles /139104/kenneth-neil-cukier-andviktor-mayer-schoenberger/the-rise-of -big-data

Bình luận
Trị dứt điểm bệnh ngủ ngáy Gia đình trái cây Pushmax Công ty Cổ phần Sản xuất - Thương mại Violet