Khi các công ty công nghệ lần đầu tung ra những sản phẩm AI tạo sinh (generative AI), một số nhà phê bình đã lập tức lo sợ về viễn cảnh sụp đổ của ngành truyền thông. Mọi sản phẩm viết, hình ảnh hay video đều trở nên đáng ngờ. Nhưng đối với các nhà xuất bản tin tức và giới báo chí, một thảm họa khác còn đang lấp ló phía trước.
Các chatbot đã chứng tỏ khả năng giữ chân người dùng trong cuộc trò chuyện liên tục. Chúng làm điều đó bằng cách trả lời mọi câu hỏi, thường bằng cách tóm tắt các bài báo từ những trang tin. Hệ quả là, ngày càng ít người rời khỏi các nền tảng AI để truy cập trực tiếp vào các trang tin – một diễn biến đe dọa sự tồn tại của ngành truyền thông và sinh kế của nhà báo khắp nơi.
Một nghiên cứu quy mô lớn cho thấy AI Overviews của Google – tính năng hiển thị tóm tắt nội dung trang web ngay phía trên kết quả tìm kiếm – đã khiến lưu lượng truy cập tới các trang ngoài giảm hơn 34%. CEO của DotDash Meredith – công ty sở hữu People, Better Homes & Gardens và Food & Wine – cho biết họ đang chuẩn bị cho kịch bản “Google Zero”, tức lượng truy cập từ Google bằng không. Một số người cho rằng việc sụt giảm lượng truy cập do chatbot gây ra chính là một phần lý do khiến Business Insider và Daily Dot gần đây phải cắt giảm nhân sự. “Business Insider được xây dựng cho một thế giới internet không còn tồn tại nữa,” một cựu nhân viên nói với phóng viên Oliver Darcy.
Không phải mọi nhà xuất bản đều chịu rủi ro ngang nhau: những bên phụ thuộc vào lượng độc giả đại chúng đến từ công cụ tìm kiếm và mạng xã hội có nguy cơ lớn hơn so với những nhà xuất bản chuyên biệt, có lượng độc giả đăng ký trung thành. Nhưng không ai hoàn toàn an toàn. Được phát hành vào tháng 5-2024, AI Overviews hiện đã cùng với ChatGPT, Claude, Grok, Perplexity và nhiều sản phẩm AI khác thay thế vai trò tìm kiếm đối với hơn 25% người Mỹ, theo một nghiên cứu.
Các công ty AI huấn luyện chatbot bằng khối lượng khổng lồ sách và bài báo bị “trộm cắp”, đồng thời quét (scrape) các bài tin tức để tạo phản hồi cập nhật theo thời gian thực. Các mô hình ngôn ngữ lớn (LLM) cũng được huấn luyện từ nội dung công khai, nhưng phần giá trị nhất – đặc biệt khi người dùng hỏi về thông tin thời sự – lại nằm sau tường phí (paywall). Nói cách khác, các tòa soạn tạo ra giá trị, còn các công ty AI “đánh cắp” khán giả, phí đăng ký và doanh thu quảng cáo.
“Mối đe dọa hiện hữu” đối với báo chí
Rich Caccappolo, phó chủ tịch mảng truyền thông của công ty xuất bản Daily Mail – tờ báo có lượng phát hành lớn nhất Anh Quốc – nói rằng tất cả nhà xuất bản “đều thấy rõ AI Overviews sẽ làm sụp đổ lượng truy cập từ tìm kiếm, phá vỡ trụ cột căn bản của mô hình doanh thu số.”
Các công ty AI khẳng định rằng chatbot vẫn sẽ gửi người đọc trở lại trang tin, nhưng không đưa ra bằng chứng. Các nhà xuất bản sách, đặc biệt là sách phi hư cấu và giáo khoa, cũng dự đoán doanh số sẽ sụt giảm nghiêm trọng, khi chatbot có thể tóm tắt và giải thích chi tiết nội dung sách. Dù họ đã cố gắng phản kháng, phần lớn đều nhận thấy cán cân quyền lực nghiêng hẳn về phía các công ty AI. Thế giới đang thay đổi nhanh chóng – có thể là vĩnh viễn – và nền báo chí tự do đang vật lộn để sinh tồn.
Các nhà xuất bản hiện phản ứng theo hai hướng. Thứ nhất là kiện tụng. Ít nhất 12 vụ kiện, với hơn 20 nhà xuất bản, đã được đệ đơn chống lại các công ty AI. Nhưng kết quả vẫn rất mơ hồ, và có thể chỉ được định đoạt sau khi thiệt hại không thể cứu vãn đã xảy ra.
Thứ hai là thương lượng. Nhiều nhà xuất bản đang ký thỏa thuận với các công ty AI, cho phép chúng tóm tắt hoặc huấn luyện trên nội dung biên tập. Một số, như The Atlantic, chọn cả hai hướng: vừa hợp tác với OpenAI, vừa kiện Cohere. Trong hai năm qua, đã có ít nhất 72 thỏa thuận cấp phép giữa các nhà xuất bản và công ty AI.
Nhưng đây không phải cuộc chơi công bằng. Không có mức giá tiêu chuẩn nào cho việc huấn luyện mô hình AI bằng một cuốn sách hay bài báo. Các công ty AI biết rõ nội dung họ cần, và vì họ đã từng lấy mà không trả tiền, họ có quyền mặc cả cực lớn. Có trường hợp, một cuốn sách chỉ được cấp phép với vài trăm USD, và nếu nhà xuất bản đòi giá cao hơn, công ty AI từ chối rồi lén lấy luôn.
Ngoài ra, giá trị của từng loại nội dung đối với AI không đồng đều. Công ty Ziff Davis (đơn vị sở hữu nhiều tạp chí công nghệ) phát hiện rằng nội dung từ các nguồn “có thẩm quyền cao” – như báo lớn và tạp chí danh tiếng – được các công ty AI ưa chuộng hơn so với blog hoặc bài đăng mạng xã hội. Các nhà nghiên cứu của Microsoft cũng công khai nhấn mạnh “tầm quan trọng của dữ liệu chất lượng cao”, đặc biệt là dạng giáo trình, sách giáo khoa.
Tuy nhiên, vẫn chưa có nhiều hiểu biết về loại nội dung nào giúp mô hình AI cải thiện tốt nhất. Liệu tiểu sử có quan trọng hơn sách lịch sử? Văn học hư cấu chất lượng cao có ích không? Sách cũ còn giá trị không? Amy Brand, giám đốc nhà xuất bản MIT Press, nói rằng “một giải pháp có thể xác định giá trị công bằng của từng nội dung do con người sáng tạo trong thị trường huấn luyện LLM sẽ là điều cực kỳ cần thiết.”
Vấn đề pháp lý và quyền kiểm soát
Quyền thương lượng của nhà xuất bản còn bị giới hạn bởi việc họ gần như không thể ngăn AI sao chép nội dung. Ngay cả giao thức chặn robot (Robots Exclusion Protocol) – tiêu chuẩn để chặn quét dữ liệu – vẫn dễ bị vượt qua. Các công ty AI lại giấu kín dữ liệu huấn luyện, khiến các nhà xuất bản không thể biết chatbot nào đang dùng bài viết của mình, và do đó không biết nên kiện ai. Một số chuyên gia, như Tim O’Reilly, đề xuất rằng pháp luật nên buộc công ty AI tiết lộ dữ liệu có bản quyền trong quá trình huấn luyện, nhưng hiện chưa có đạo luật nào yêu cầu điều đó.
Điều này dẫn đến câu hỏi: Nếu các công ty AI đã lấy nội dung miễn phí, tại sao giờ họ phải trả tiền? Nhiều công ty lập luận rằng việc huấn luyện LLM trên sách, bài viết có bản quyền là “sử dụng hợp lý” (fair use).
Có lẽ các thỏa thuận hiện nay chỉ là biện pháp phòng ngừa trước khả năng tòa án ra phán quyết bất lợi. Nếu việc huấn luyện miễn phí bị cấm, những công ty đã ký hợp đồng với nhà xuất bản sẽ có lợi thế cạnh tranh. Ngoài ra, ký thỏa thuận còn là cách dàn xếp ngoài tòa – phù hợp hơn với những nhà xuất bản thận trọng hoặc yếu thế.
Một số học giả, như James Grimmelmann, cho rằng các công ty AI có thể lập luận rằng số tiền trả trong các thỏa thuận không phải để mua bản quyền huấn luyện, mà để đổi lấy truy cập vào phiên bản bài viết sạch, nguồn dữ liệu thời gian thực, hoặc miễn trừ trách nhiệm pháp lý khi chatbot đạo văn. Cũng vì lý do này, các công ty công nghệ thường gọi đây là “quan hệ đối tác”, chứ không phải “thỏa thuận cấp phép”.
Dù thế nào, số tiền thu được từ các thỏa thuận này chẳng đủ để cứu báo chí. Những ai có thể sống sót qua làn sóng AI này sẽ phải tái phát minh mô hình kinh doanh – nhưng chưa ai biết làm thế nào.
Một “Facebook và Google” mới, nhưng tàn khốc hơn
Ngành xuất bản từng quen với đe dọa công nghệ, đặc biệt là mất doanh thu quảng cáo vào tay Facebook và Google – công ty vừa bị kết luận độc quyền bất hợp pháp trong quảng cáo trực tuyến (dù họ đang kháng cáo). Nhưng AI tạo sinh có thể là đòn chí tử cho quyền lực thứ tư (Fourth Estate): lần này, thung lũng Silicon tước luôn khán giả của báo chí.
Dĩ nhiên, nếu báo chí sụp đổ hàng loạt, một số nhà báo vẫn có thể tồn tại – trong “nền kinh tế sáng tạo” thông qua Substack, YouTube hay TikTok. Nhưng không phải ai cũng có thể chuyển sang đó. Báo chí điều tra – loại hình phơi bày tham nhũng và lạm quyền – đòi hỏi nguồn lực lớn và chịu rủi ro pháp lý cao, những điều tự do không thể đáp ứng.
Nếu báo chí biến mất, các công ty AI có thiệt hại không? Xét cho cùng, chatbot vẫn cần báo chí để trả lời câu hỏi về thế giới thực. Chẳng phải ngành công nghệ có lợi ích trong việc duy trì báo chí sao?
Trên thực tế, có dấu hiệu cho thấy họ nghĩ ngược lại. Tại hội nghị DealBook Summit của The New York Times vào tháng 12-2024, CEO Sam Altman (OpenAI) được hỏi về việc các tác giả nên cảm thấy thế nào khi tác phẩm của họ bị dùng để huấn luyện AI. Ông nói: “Tôi nghĩ chúng ta cần một thỏa thuận, một tiêu chuẩn hay một giao thức mới để bù đắp cho người sáng tạo.” Ông gợi ý về hệ thống “micropayments” – trả tiền lẻ mỗi khi tên, hình ảnh hay phong cách của tác giả được sử dụng. Nhưng điều đó hoàn toàn trái ngược với thực tế hiện nay, khi sản phẩm của OpenAI đang bắt chước phong cách của nghệ sĩ và nhà văn mà không có bồi thường hay cơ chế từ chối hiệu quả nào.
CEO Google Sundar Pichai cũng được hỏi về việc trả công cho tác giả tại cùng hội nghị. Ông cho rằng thị trường sẽ tự điều chỉnh, có thể không còn cần đến nhà xuất bản trong tương lai. Đây là quan điểm quen thuộc: giống như trong nhiều ngành khác mà họ từng “phá vỡ”, giới công nghệ Thung lũng Silicon xem các thể chế cũ là trung gian cần loại bỏ để đạt hiệu quả cao hơn.
Giống như Uber từng dụ tài xế rời taxi truyền thống rồi kiểm soát họ bằng thuật toán – mang lại tiện lợi cho người dùng nhưng hủy hoại sinh kế của hàng triệu tài xế chuyên nghiệp – AI đang làm điều tương tự với báo chí. Pichai thậm chí nói: “Sẽ có một thị trường trong tương lai – những người sáng tạo sẽ sáng tạo cho AI. Rồi mọi người sẽ tự tìm ra cách.”
Một câu nói tưởng như đơn giản, nhưng ẩn chứa lời tuyên án lạnh lùng: Tương lai mà Silicon Valley hình dung có thể là tương lai không còn báo chí – chỉ còn những người viết phục vụ máy móc.
_________
Phỏng dịch từ “The End of Publishing as We Know It” của Alex Reisner, The Atlantic











