6 công đoạn trong quy trình xuất bản báo chí 4.0

01/06/2018, 17:35

6 công đoạn trong quy trình xuất bản báo chí 4.0 - Bản chất của báo chí 4.0 là sự kết hợp giữa người làm báo và những phương tiện sản xuất báo chí của nền công nghiệp 4.0, dựa trên các thông tin thu thập từ các thiết bị kết nối Internet (IoT).

Năm 2014, lần đầu tiên Robot đã viết một bản tin tức thời (breaking news) cho tờ Los Angeles Time. Ảnh: TL

Bài viết sau đây mô tả quy trình 6 bước và các kỹ thuật phân tích, sử dụng dữ liệu để xuất bản bài báo.

7 giờ 53 phút sáng ngày 17/3/2014, Thời báo Los Angeles đăng tin ngắn khoảng 100 chữ:

“Dư chấn động đất: rung chuyển 2.7 độ gần Westwood

Phóng viên: Ken Schwencke

Một trận động đất nông, có cường độ 2.7 độ Richter, xảy ra sáng nay, thứ hai, tại vị trí cách Westwood 5 dặm, theo thông tin từ Viện Địa lý Hoa Kỳ. Rung lắc xảy ra lúc 7h23 phút sáng giờ Thái Bình Dương tại độ sâu 4.3 dặm.

Trước đó, một trận động đất 4.4 độ Richter xảy ra lúc 6h25 phút sáng, có thể cảm nhận rõ tại Nam California.
Theo Viện Địa lý Hoa Kỳ, tâm chấn cách Beverly Hills 5 dặm, cách Santa Monica 6 dặm, và cách Tây Holywood 6 dặm.

Trong vòng 10 ngày qua, có một trận động đất cường độ từ 3 độ Richte trở lên có tâm chấn trong khu vực nêu trên.

Thông tin này lấy nguồn từ Dịch vụ cảnh báo động đất của Viện Địa lý Hoa Kỳ. Bài báo được tạo ra từ các thuật toán do phóng viên viết".

Tin ngắn đơn giản này đã được lịch sử báo chí thế giới ghi nhận là sản phẩm báo chí 4.0 đầu tiên. Từ đó tới nay, sử dụng trí tuệ nhân tạo để viết báo đã được áp dụng tại nhiều cơ quan báo chí. Trong năm 2014, một số cơ quan tiên phong như Thời báo Los Angeles, hãng thông tấn AP, Forbes, ProPublica đã dùng phần mềm tự viết báo. Năm 2016, tờ Bưu điện Washington đã xuất bản 850 bài báo do máy tính viết. Tại Anh, từ tháng 11/2017, dự án Phóng viên và Rô-bốt do AP và Urbs Media khởi xướng được Google tài trợ bắt đầu dùng rô- bốt viết báo tại 20 cơ quan báo chí. Với ước mơ trở thành cường quốc trí tuệ nhân tạo, từ tháng 1/2017 Trung Quốc đã thử nghiệm dự án dùng phần mềm viết báo tại Nhật báo Đô thị Phương Nam (Southern Metropolis) kết hợp với các nhà khoa học máy tính và truyền thông của Đại học Bắc Kinh.

Các khóa học báo chí 4.0 (robot-journalism) được mở tại các tập đoàn báo chí và các trường đào tạo báo chí. Báo chí rô-bốt, báo chí kết hợp giữa phóng viên và máy, phần mềm viết báo, hay báo chí tự động hóa là những tên gọi khác nhau của làn sóng áp dụng công nghệ trong cuộc chạy đua tới nền Báo chí 4.0.

Công ty công nghệ Đức AX Semantics mô tả 6 công đoạn của quy trình xuất bản sản phẩm báo chí 4.0: (1) thu thập dữ liệu lớn; (2) nạp dữ liệu; (3) thiết kế dàn trang; (4) đa dạng hóa bài báo; (5) phóng viên duyệt và điều chỉnh và (6) xuất bản.

Con người vẫn đang tích cực khai thác Dữ liệu lớn (Big Data). Ảnh: TL

Thu thập dữ liệu lớn

Mỏ dữ liệu khổng lồ của báo chí bao gồm: số liệu quan trắc thời tiết, thị trường chứng khoán, kết quả thi đấu thể thao, lịch trình các chuyến bay và tình hình giao thông v.v.. Phóng viên không cần đích thân theo dõi những số liệu này. Phần mềm làm báo kết nối với nguồn cung cấp dữ liệu từ các cơ quan quản lý số liệu, như cơ quan khí tượng thuỷ văn, sàn giao dịch chứng khoán, ban tổ chức các giải thi đấu, cơ quan điều hành mạng lưới hàng không và giao thông công cộng. Số liệu hiển thị trên máy tính hoặc bảng điện tử của các cơ quan này sẽ đồng thời truyền tới phần mềm viết báo của các cơ quan báo chí.

Trong ví dụ về động đất tại California, các số liệu cảnh báo động đất của Viện Địa lý Hoa Kỳ được máy tính đưa tới phần mềm của Thời báo Los Angeles. Dựa trên số liệu này, phần mềm quyết định có viết tin hay không. Động đất dưới 3 độ Richter sẽ không thành tin. Ngược lại, nếu số liệu cho thấy động đất trên 3 độ, kèm nhiều dư chấn, phần mềm quyết định sẽ viết tin bài phản ánh. Từ lúc máy quan trắc đo được số liệu về động đất, tới lúc phần mềm cho ra mẩu tin ngắn như trên chỉ trong vòng 3 phút.

Nguồn dữ liệu lớn sẽ ngày càng được bổ sung do thiết bị và công nghệ thu thập thông tin cá nhân sẽ ngày càng tăng lên, ví dụ điện thoại thông minh, đồng hồ thông minh, kính thực tại ảo, mạng xã hội, hay các trình duyệt web.

Vì nguồn dữ liệu là các con số, nên những gì đo lường được sẽ trở thành nguyên liệu cho các sản phẩm báo chí 4.0. Các bản tin thời tiết, bản tin chứng khoán, bản tin cảnh báo thiên tai, diễn biến và kết quả các trận thi đấu thể thao, là những nội dung thích hợp nhất để chuyển giao cho máy tính đảm nhận.

Việc xử lý dữ liệu hiện nay trở nên rất dễ dàng khi có máy tính. Ảnh: TL

Xử lý dữ liệu

Đây là bước quan trọng nhất quyết định nội dung của bài báo. Lúc này các dữ liệu được sắp đặt vào trong những mô hình cấu trúc có sẵn. Cấu trúc đa dạng về mặt quy mô: cấu trúc cụm từ, cấu trúc câu, đoạn văn, cấu trúc bài, trạng thái tinh thần toàn bài. Có hai cách để thiết lập cấu trúc.

Cách thứ nhất, đưa vào máy tính một lượng tin, bài khổng lồ, để máy tính tự tổng hợp những cách dùng từ, cách viết câu lặp lại nhiều lần trong số những tin bài đó. Cách này giống như trong các lớp học tại trường báo chí, giảng viên đưa ra bài viết mẫu để học viên phân tích và viết theo mẫu.

Cách thứ hai là nhập vào máy tính các cấu trúc có sẵn. Ví dụ: câu gồm chủ ngữ, vị ngữ. Tin gồm có các thành tố việc gì, xảy ra ở đâu, khi nào, ai tham gia, xảy ra như thế nào, vì sao. Thông tin mới nhất, quan trọng nhất đưa lên đầu, thông tin ít quan trọng hơn đưa vào phần cuối bài. Cách này cũng giống như tại các trường báo chí, giảng viên đưa sẵn các công thức 5W+1H, cấu trúc tin hình tháp ngược, hoặc cấu trúc bài đồng hồ cát v.v.. để người học tìm các chi tiết số liệu đưa vào các công thức có sẵn.

Không chỉ kỹ thuật viết báo mà các tư tưởng của nền báo chí cũng có thể được phần mềm tái hiện. Nếu như báo chí phương Tây có xu hướng nhấn mạnh mặt tiêu cực và mâu thuẫn để thu hút sự chú ý, thì báo chí phương Đông chú trọng mặt tích cực, tính ôn hoà và ổn định, không đề cao tính trái chiều và các tranh luận. Vì thế, rô-bốt báo chí của Nhật báo Đô thị Phương Nam (Trung Quốc) cũng phải tuân thủ cung cấp thông tin có tính định hướng đúng cho dư luận và chú trọng xuất bản các thông tin tích cực, như những gì Chính phủ Trung Quốc mong đợi từ phía người làm báo.

Để làm được điều này cần có người “dạy” cho máy học. Rô-bốt không thể tự phân biệt giữa tin tích cực hay tin tiêu cực nếu như phóng viên không lập trình cho rô- bốt. Ví dụ, rô-bốt có thể tự viết ra một đoạn thông báo về chuyến bay bị huỷ và hoãn chuyến, nhưng cần có người mã hóa (code) để rô-bốt hiểu “huỷ và hoãn” mang ý nghĩa tiêu cực và có tầm ảnh hưởng tới số đông.

Vai trò của người mã hóa dữ liệu vô cùng quan trọng. Người này sẽ gán cho thông tin một số ý nghĩa và sắc thái theo cách hiểu của họ, ví dụ “nắng 20 độ, trời không mây” là “trời đẹp”, “động đất 3 độ Richter trở xuống” là “không nguy hiểm”, “chỉ số chứng khoán màu xanh” là “tăng lên”, hoặc một vận động viên chạy về đích trong thời gian ngắn hơn bao nhiêu giây thì máy sẽ có thể ghi nhận là “kỷ lục thế giới”.

Trong giai đoạn “dạy” máy học, người mã hóa dữ liệu cài đặt vào trong máy tính những tri thức của bản thân họ. Trong giai đoạn máy vận hành (có thể là rô-bốt, hay một phần mềm, một ứng dụng), người mã hóa sẽ “dạy” máy tính những tri thức của họ, sau đó máy tính sẽ lặp lại những tri thức đó. Sau quá trình mã hoá, máy móc sẽ có cách suy nghĩ và đánh giá như người mã hóa nó.

Nhưng bản chất của công việc mã hóa là lặp lại nhiều lần trên máy tính, ít tương tác với người khác, vì vậy khó thu hút được những phóng viên vốn ưa thích công việc có tính chất xê dịch, giao lưu và gặp gỡ với nhiều người ở nhiều tầng lớp khác nhau.

Trí tuệ nhân tạo đã mở ra chân trời mới của cách mạng công nghiệp 4.0. Ảnh: TL

Thiết kế - trình bày

Trong thiết kế trình bày các sản phẩm truyền thông, trí tuệ nhân tạo đã vượt xa nhà thiết kế trong khả năng tùy chỉnh. Các ứng dụng thu thập thông tin một cách tự động biết người dùng trang web nhìn vào điểm nào, nhìn trong bao nhiêu lâu, đọc đoạn nào lâu hơn, bỏ qua đoạn viết nào, click chuột vào đâu, nhìn màu sắc nào lâu nhất, v.v.. Sau đó, ứng dụng tìm ra cách thiết kế, trình bày trang web cho phù hợp nhất với trải nghiệm của người dùng.

Mỗi bản tin do rô-bốt viết không dài, chỉ 100 chữ như trong bản tin của Thời báo Los Angeles, hay 300 chữ như tin đăng trên Nhật báo Đô thị Phương Nam. Máy sẽ tự tìm ra từ khóa (key word) có ý nghĩa nổi bật nhất trong bài. Sau đó tự tìm ảnh phù hợp nhất với từ khóa. Với chữ viết, ảnh và các định dạng thiết kế dàn trang có sẵn, máy tính sẽ nhanh chóng hoàn thiện khâu trình bày bài báo.

Đa dạng hóa bài báo

Bằng các phần mềm dịch thuật, một bài báo có thể được máy tính dịch ra nhiều ngôn ngữ khác nhau chỉ trong một vài giây. Xuất bản một bài bằng nhiều thứ tiếng khác nhau còn là cách để người làm báo đến với nhiều người đọc hơn, thu hút quảng cáo ở nhiều quốc gia hơn.

Từ những thông tin của cá nhân người sử dụng, máy tính có khả năng thêm vào bài báo một số yếu tố cá nhân hóa để thể hiện sự kết nối trực tiếp giữa người dùng và bài báo. Ví dụ, cụm nội dung sau được gửi vào thư điện tử của người đăng ký đọc báo: “lời chào buổi sáng + tên độc giả + 1 câu giới thiệu bài báo + tóm tắt bài báo + đường link liên kết tới bài báo + câu chào kết thúc + chữ ký của biên tập viên”. Cách làm này giúp người đọc có cảm giác được giao lưu trực tiếp với người làm báo, bằng chính ngôn ngữ mẹ đẻ, giúp tạo mối quan hệ gắn bó và trở thành bạn đọc trung thành.

Vẫn rất cần có phóng viên đọc duyệt và điều chỉnh trong quá trình làm báo 4.0. Ảnh: TL

Phóng viên đọc duyệt và điều chỉnh

Đây là khâu duy nhất có sự tham gia trực tiếp của con người trong quá trình làm báo thời 4.0. Tuy nhiên, phóng viên không cần kiểm chứng thông tin do rô-bốt hay phần mềm viết ra, vì dữ liệu đầu vào lấy từ nguồn có kiểm chứng, có cơ quan chịu trách nhiệm.

Những tin do máy làm chỉ nêu dữ liệu đơn thuần mà không có ý kiến bình luận và cảm xúc. Vì vậy, nếu muốn biến tin thành bài dài, phóng viên cần phỏng vấn chuyên gia, phỏng vấn người dân có liên quan, để đưa thêm thông tin. Vậy ai thực sự là tác giả bài báo? Trong ví dụ tin về động đất của tờ Thời báo Los Angels, phóng viên đồng thời là lập trình viên. Vì vậy anh ta hoàn toàn là tác giả bài viết. Tại nhật báo Đô thị Phương Nam, rô-bốt viết báo tự động có bút danh là “Tiểu Nam”. Bút danh này được sử dụng trong những tin về thông báo lịch trình và vé tàu xe.

Con người không thể bị thay thế hoàn toàn trong làm báo, đặc biệt là ở các chủ đề cần nhiều phân tích cảm xúc và ý kiến cá nhân, như bình luận chính trị, phân tích văn học nghệ thuật, phỏng vấn, ký sự. Chính vì thế, phóng viên nếu không muốn bị đào thải trong Cách mạng công nghiệp 4.0 thì phải tìm nhiều thông tin về cảm xúc và ý kiến bình luận riêng của nguồn tin. Phần còn lại, dữ liệu, số liệu, cái gì xảy ra bao giờ, ở đâu, hãy để máy lo.

Xuất bản

Khi xuất bản bài báo sẽ hiện diện trên trang web, báo in, tự qua phần mềm đọc trở thành tin phát thanh, gửi tin vào hộp thư điện tử, hộp thư mạng xã hội, tin nhắn vào điện thoại cho từng người sử dụng.

Như vậy, quy trình xuất bản tin bài thời báo chí 4.0 sẽ chỉ còn kéo dài vài phút. Trong ví dụ trên, động đất xảy ra lúc 6 giờ 25 phút sáng, phần mềm tự động chạy ra bài báo, khi phóng viên ngủ dậy, đọc duyệt và xuất bản lúc 7 giờ 53 phút. Chỉ 88 phút sau khi trận động đất xảy ra, cơ quan báo chí không cần cử phóng viên tới hiện trường, mà vẫn có bài đăng báo.

Đây là mô tả quy trình xuất bản một tin bài dưới sự trợ giúp của máy tính. Trong tương lai, khi tất cả loại máy móc kết nối với nhau trên nền tảng Internet, nghề báo cũng sẽ không thể đứng ngoài cuộc chơi số 4.0. Những công việc theo chu kỳ lặp lại sẽ do máy tính làm. Hơn bao giờ hết phóng viên phải chủ động sáng tạo và đổi mới mỗi ngày. Bởi lẽ, nếu phóng viên tự lặp lại chính mình sẽ không làm việc hiệu quả bằng rô-bốt và nhanh chóng bị đào thải.

Mạch Lê Thu

--

Tài liệu tham khảo
1. AX Semantic Report, Media 4.0: The future of news produced by man and machine, http://blog.axsemantics.com/media-40-the-future-of-news-producedby-man-and-machine.html, truy cập 8/5/2018
2. China Real Time Report, In era of Journalism Cutbacks, a Chinese “Robot-Reporter”, https://blogs.wsj.com/chinarealtime/2017/01/24/in-eraof-journalism-cutbacks-a-chinese-robot-reporter/, truy cập 8/5/2018

Xem thêm: Series Làm báo trong thời đại Cách mạng Công nghiệp 4.0

>>> Cách mạng Công nghiệp 4.0: Thách thức trong đào tạo báo chí

>>> Cơ hội mới cho báo chí trong kỷ nguyên Big Data

>>> 6 công đoạn trong quy trình xuất bản báo chí 4.0

>>> Phát thanh trong môi trường truyền thông 4.0

>>> Trí thông minh nhân tạo và cái “gốc” của báo chí

>>> Báo chí thời công nghệ 4.0

>>> Thách thức của báo in trong bối cảnh Cách mạng Công nghiệp 4.0

Bình luận