AI học thuật và hiệu ứng Matthew: cho kẻ có, không cho kẻ khó (bài dịch)

Bài thảo luận được dịch từ bài The Matthew effect in AI summary của tác giả Jefferson Pooley, link tới viết gốc được ghi ở cuối bài.

Tâm điểm của những ứng dụng AI khi quảng cáo cho nhóm các nhà nghiên cứu và giới học thuật nằm ở tính năng tóm tắt trong bối cảnh quá tải thông tin. Sau khi xem xét ảnh hưởng của phân phối sự chú tâm một cách bất công lên tri thức học thuật, với đại diện là hiệu ứng Matthew, tác giả Jefferson Pooley cho rằng những công cụ AI học thuật rồi sẽ mang những thiên vị và định kiến quay lại với những giai tầng học thuật mới theo cách rất khó để kiểm soát.

Trong hơn một năm rưỡi trở lại đây, những công ty AI khổng lồ của Mỹ tung ra một lọat sản phẩm với những cái tên rất khó phân biệt ai là ai: Deep Research (Gooogle), Research (Anthropic), Deep Research (OpenAI), Researcher (Microsoft), và lại là Deep Research (Perplexity). Trong khi đó, nhóm các nhà xuất bản học thuật giàu có cũng kịp tung ra những sản phẩm AI dựa trên tài sản của chính họ: kho dữ liệu các bài nghiên cứu học thuật. Các công cụ đó là AI Discovery (Elsevier), Web of Science Research Assistant (Clarivate), and Dimensions AI Assistant (Digital Science). Hai rổ công cụ ấy có chung lời hứa: chúng sẽ trả lại cho các nhà nghiên cứu những đọan văn cô đọng và hoàn toàn đầy đủ trích dẫn.

Những công ty AI và các nhà xuất bản lấy dữ liệu từ những kho kiến thức giao nhau. Các sản phẩm của Elsivier và các nhà xuất bản dùng sức mạnh của kho bài báo học thuật, còn các công cụ Deep Research sẽ góp nhặt không chỉ trong nhóm học thuật mà còn từ các báo cáo, Wikipedia, và các bài đăng trên internet. Nhưng các công cụ này đều hướng về một nơi: tóm tắt và trích dẫn.

Ngay cả cách quảng cáo của các công cụ cũng khó phân biệt. Google gọi công cụ nghiên cứu dựa trên Gemini của mình là “trợ lý nghiên cứu cá nhân của bạn”. OpenAI thì tự hào về khả năng tạo ra các báo cáo ở “cấp độ phân tích của một nhà nghiên cứu” với “trích dẫn rõ ràng”. Công cụ Research của Anthropic còn hứa hẹn cho “câu trả lời toàn diện, chất lượng cao trong vài phút” và “trích dẫn dễ kiểm tra”. Tất cả những lời lẽ này cũng có trong quảng cáo của các nhà xuất bản. AI Discovery của Elsevier tạo ra “bài tóm tắt nghiên cứu đáng tin cậy và dễ đọc hiểu”. Sản phẩm của Clarivate, Web of Science Research Assistant, giúp bạn “tổng hợp tài liệu hiệu quả hơn”. Dimensions AI Assistant, từ Digital Science (công ty con của Springer Nature), khoe là sẽ trả về “kết quả tóm tắt tức thì và phù hợp”. Thung lũng Silicon và các nhà xuất bản lớn thậm chí còn dùng chung ngôn từ khi nói về sản phẩm. Chẳng hạn, gần đây Scopus AI của Elsevie phát hành tính năng mang thương hiệu “Deep Research” của riêng mình.

Cốt lõi của tất cả các công cụ này là một loạt các động từ: Làm nổi bật, xếp hạng, tóm tắt và đề xuất. Theo nghĩa này, các sản phẩm AI đã và đang hoạt động như những người đứng ra phân xử tri thức. Chúng tự chọn ra kẻ thắng và người thua dựa trên những nghiên cứu được cho phép tìm thấy.

Có hai vấn đề lớn liên quan mật thiết đến vai trò này: Một, các mô hình được đào tạo dựa trên quá khứ học thuật và Hai, cơ chế lọc của các công cụ trên rất khó hiểu. Kết quả là chúng có thể vô tình “tái thả” nhiều thành kiến đã từng đặt dấu mốc cho lịch sử học thuật, xung quanh giới tính, địa lý và các khía cạnh khác biệt nào đó.

Vì chuyện này mà có khi dựng lại một khái niệm cũ trong xã hội học khoa học lại hữu ích. Đó là hiệu ứng Matthew, được Robert Merton đặt tên từ nhiều thập kỷ trước. Hiệu ứng này mô tả hiện tượng các học giả nổi bật và được trích dẫn nhiều có xu hướng càng nổi tiếng và càng hay được trích dẫn hơn nữa. Ngược lại, các học giả ít khi được trích dẫn thì có xu hướng ngày càng bị lãng quên theo thời gian. Trên thực tế, sự vận động xoay quanh “lợi thế lũy tiến” này (accumulative advantage) đã đào sâu thêm những bất bình đẳng có hệ thống cho bộ máy sản xuất tri thức. Ví dụ như số lượng trích dẫn giảm đối với các nhà khoa học nữ, một hiện tượng được Margaret Rossiter khéo léo đặt tên là hiệu ứng Matilda vào năm 1993.

Việc sử dụng phổ biến các công cụ AI tạo sinh trong nghiên cứu học thuật có thể làm hiệu ứng Matthew trầm trọng hơn, ở quy mô tầm cỡ các nhà xuất bản hàng đầu thế giới chứ không hề nhỏ. Khó nhất là lại chẳng có bằng chứng cho người ta mò mẫm theo để kiểm chứng.

Vấn đề này tương tự như việc thiên vị ngầm đã được phát hiện ở các mô hình tạo sinh hiện tại. Ví dụ, các công cụ xử lý hình ảnh được huấn luyện với dữ liệu chủ yếu là ảnh của người da trắng và nam giới sẽ tái tạo sự lệch lạc trong các kết quả được tạo ra từ các yêu cầu. Nếu lấy những nghiên cứu đã có sẵn thành kiến làm dữ liệu huấn luyện (như Web of Science khoe khoang với “120 năm nghiên cứu”), có thể các mô hình nghiên cứu lại đưa ra các kết quả gây thêm bất bình đẳng.

Cái khó là chúng ta sẽ không thực sự biết được thuật toán lựa chọn ra sao, do tính chất “hộp đen” của các mô hình. Các công cụ này chả khác gì máy giặt khi chúng gột bỏ ngữ cảnh để các khuyến nghị trở nên trừu tượng và che giấu các “suy luận” theo xác suất. (Từ “suy luận” – reasoning được đặt trong ngoặc kép để nhân hóa. Điều này thể hiện quan điểm của tác giả cho rằng các mô hình không thật sự biết suy nghĩ.) Những thiên vị hiện có, như xu hướng tự trích dẫn của các học giả nam, trở thành một lớp vỏ hợp pháp nếu ta bắt tay vào quá trình nghiên cứu trước tiên thông qua con mắt của thuật toán. Hoặc như các ranh giới giữa Bán cầu Bắc và Bán cầu Nam, và các vùng nói tiếng Anh bản địa tạo ra những khoảng cách khởi nguồn từ lịch sử địa chính trị, bao gồm di sản của chủ nghĩa thực dân châu Âu, có thể còn bị nới rộng hơn nữa. Nói tóm lại, các mô hình ngôn ngữ này sẽ càng thiên vị cho đặc quyền. Nhiều bằng chứng cho thấy việc này đang xảy ra.

Hiệu ứng Matthew trong giới học thuật (dành cho người)

Nhà xã hội học Robert Merton tại đại học Columbia đã đặt tên cho hiệu ứng Matthew vào năm 1968. Ý tưởng những người sẵn nổi tiếng lại càng nổi hơn xuất phát từ Kinh Tân Ước: “Vì ai sẵn có, sẽ được ban cho, và người ấy sẽ có dư dật; còn ai không có, thì ngay cả những gì người ấy đang có cũng sẽ bị lấy đi” (Matthew 25:29). Theo Merton, nguyên nhân khiến những học giả đã giàu lại càng giàu là sự quen thuộc. Ví dụ, nhà khoa học lỗi lạc A nào đó đã được các học giả khác ghi nhớ; khi cần trích dẫn, tham khảo hoặc đọc, những cái tên đó luôn hiển hiện. Sự lan truyền sau đó của cái tên A nổi tiếng dẫn đến những ấn tượng càng sâu sắc hơn và càng được nhắc đến nhiều. Kết quả là một hiệu ứng dây chuyền tạo ra sự phổ biến (visibility).

Merton gọi động thái này là “phân bổ sai lệch” sự công nhận. Nó tạo nên bất công đối với những nhà khoa học (thường là người trẻ) mà công lao của họ bị chuyển sang một số ít người không xứng đáng. Merton cho rằng “cấu trúc giai cấp” trong khoa học được củng cố bởi hiệu ứng Matthew. Tương tự như hệ thống phân tầng xã hội, cấu trúc giai cấp học thuật phân bổ cơ hội không đồng đều. Những người đã nổi tiếng không chỉ giành được vinh dự và sự kính trọng; họ còn có “quyền tiếp cận các phương tiện sản xuất khoa học”, và nhờ đó có cơ hội đạt được nhiều uy tín và nguồn lực hơn nữa.

Tuy nhiên, Merton cũng đưa ra nhiều điều kiện ràng buộc trong phê phán của mình. Đó là có thể hiệu ứng Matthew không công bằng với các nhà khoa học cá nhân, nhưng nó phục vụ một mục đích lành mạnh, mang tính hệ thống. Với khối lượng nghiên cứu khổng lồ (ngay cả khi xét vào năm 1968), việc tạo điều kiện cho “người giàu càng giàu thêm” giúp kiểm soát lượng tài liệu bằng cách “tập trung” sự chú ý vào những phát hiện quan trọng. “Chức năng truyền thông” này giúp dọn dẹp, tập trung sự chú ý và thúc đẩy khoa học tiến bộ. Ông cũng hạ thấp luận điểm ”lợi thế tích lũy” qua việc nhấn mạnh phẩm chất độc đáo của các nhà khoa học nổi tiếng. Những người xuất chúng thực sự khác biệt so với những người cùng ngành: Họ tự tin hơn và giỏi “tự định hướng” hơn. Họ giỏi phát hiện và trình bày những khám phá quan trọng. Vì vậy, có lẽ cuối cùng thì việc họ được chú ý lại là một điều tốt.

Tóm lại, bài học rút ra từ bài báo nổi tiếng của Merton là dù cá nhân có phải chịu bất công đến đâu, toàn bộ hệ thống khoa học vẫn được hưởng lợi. Quan điểm lạc quan về chủ nghĩa chức năng của Merton đã sớm bị thách thức vào những năm 1970, trong bối cảnh chương trình xã hội học khoa học của ông bị phê bình. Vấn đề không phải nằm ở luận điểm về hiệu ứng Matthew; thực tế, hầu hết các nghiên cứu sau đó đều cung cấp bằng chứng thực nghiệm ủng hộ luận điểm này. Vấn đề nằm ở quan điểm của Merton rằng hệ thống được hưởng lợi, ngay cả khi các cá nhân phải chịu thiệt thòi.

Rốt cuộc, không chỉ những cá nhân riêng lẻ phải chịu thiệt thòi đâu. Hiệu ứng Matthew phân chia phần thưởng của sự công nhận theo những cách thức có khuôn mẫu, dựa trên những khác biệt đã được khắc sâu trong hệ thống học thuật thời hậu chiến của Mỹ (và cả thế giới). Hãy xem xét vấn đề giới tính: Hiệu ứng Matthew là thứ góp phần gạt bỏ các nhà khoa học nữ vốn đã bị lề hóa. Những ”bất lợi tích tụ” (ngược với ”lợi thế tích tụ”) đã duy trì bất bình đẳng với phụ nữ trong giới học thuật. Đây là cáo buộc của Margaret Rossiter trong tác phẩm “Hiệu ứng Matilda”. Hiệu ứng này được đặt theo tên của Matilda Gage, một nhà hoạt động nữ quyền người Mỹ cuối thế kỷ XIX, người đã trải nghiệm và gọi tên cho sự im lặng âm ỉ. Nhà sử học gia quá cố Margaret Rossiter đã trích dẫn lịch sử cho thấy sự tích lũy công lao của các học giả nam. Thậm chí, hiệu ứng Matilda được đặt theo tên của một quá trình xóa bỏ mà chính nó sỉ nhục danh tiếng vốn không ra gì của mình.

Một trong những gương mặt “Matilda” chính là Harriet Zuckerman, học viên cao học và cũng là vợ tương lai của Merton. Bài báo năm 1968 của Merton (được trích dẫn hơn 12.000 lần) chủ yếu dựa trên luận án năm 1965 của vợ mình, Zuckerman, về những người đoạt giải Nobel. Trớ trêu thay, bài viết trên tạp chí năm 1967 của Zuckerman và cuốn sách sau này của bà lại thu hút ít sự chú ý hơn chồng mình rất nhiều. Bà hầu như còn chẳng bao giờ được ghi nhận là đồng tác giả của khái niệm này. Do đó, Margaret Rossiter đã đề xuất nửa đùa nửa thật là gọi nó là “Hiệu ứng Harriet” để vinh danh “cộng tác viên vô hình” của Merton.

Quan điểm của Rossiter về việc tiếp tục duy trì sự lề hóa có hệ thống đã được mở rộng sang những người “thiếu thốn” khác, những người chung số phận như phụ nữ, bị phớt lờ và từ chối công nhận hoặc bị loại khỏi tầm nhìn.

Có quá nhiều thứ để mà biết hết

Hiệu ứng Matthew không phải không có điểm tích cực. Merton cho rằng nó giúp cộng đồng khoa học đối phó với sự bùng nổ các ấn phẩm. Trong điều kiện có quá nhiều ấn phẩm và thiếu hụt sự chú tâm, chúng ta không thể tránh khỏi việc sàng lọc và tóm tắt. Như tác giả Ann Blair đã chứng minh: luôn có quá nhiều thứ để biết. Trong trường hợp Châu Âu thời kỳ cận đại mà Ann Blair nghiên cứu, tình trạng quá tải thông tin dẫn đến sự ra đời của nhiều công cụ lọc và tóm tắt khác nhau như mục lục (index/outline) và danh mục tài liệu tham khảo (reference). Sự xuất hiện gần đây của bản tóm tắt bài báo trên tạp chí (abstract) là một sự nhượng bộ khác đối với tình trạng quá tải thông tin.

Trích dẫn học thuật cũng là một công cụ tóm tắt. Theo cách hiểu mẫu mực trong sách giáo khoa thì tài liệu tham khảo là trụ cột của toàn bộ hoạt động khoa học; khi chúng ta trích dẫn, chúng ta đang đứng trên vai những người tiền nhiệm ddax được chọn lọc. Nhưng trích dẫn khiêm tốn còn hơn thế nữa; các trích dẫn tham khảo trong câu (in-text citations) và chú thích cuối trang (footnotes) truy vết đến các tài liệu tham khảo là những biểu tượng linh hoạt thực hiện nhiều chức năng khác nhau cho các tác giả thực hiện trích dẫn. Trích dẫn có thể thể hiện lòng trung thành, chỉ trích đối thủ, thiết lập tiền lệ và phô trương thành tích. Chúng hiện thân cho uy tín được thể hiện bằng chữ viết, có chức năng tóm tắt và định hướng, để giảm bớt gánh nặng về bằng chứng cho lập luận.

Trong nửa thế kỷ qua, chúng ta đã bắt đầu thu thập và đếm số lượng trích dẫn, chắt lọc chúng thành các chỉ số gọn gàng và có vẻ chính xác. Công việc biên soạn thư mục (bibliography) của các học giả (bibliography lớn hơn references) là nguyên liệu thô để tạo ra các bảng thống kê (tally) và chỉ mục (index). Trong mức độ trừu tượng thứ cấp, nơi các ký hiệu được tạo ra từ các ký hiệu, một số nguyên dương duy nhất đại diện cho mỗi nhà nghiên cứu chúng ta. Số lượng trích dẫn của một tạp chí cũng được đếm và xếp theo thứ tự để khuyến khích chính các bài báo khoa học đang tìm kiếm trích dẫn, làm tăng cả điểm số lẫn lợi nhuận của nhà xuất bản. Tất cả nhằm đáp ứng nhu cầu về tính dễ đọc của các nhà quản lý khoa học vội vã.

Làn sóng đo lường, trong số nhiều thứ khác, đã bổ sung thêm một lớp đệ quy khác vào hiệu ứng Matthew. Khoảng năm 1968, hiệu ứng Matthew đơn thuần dựa trên trí nhớ của các học giả, còn gọi suy nghiệm dựa trên sự phổ biến, được lặp đi lặp lại trong toàn bộ hệ thống học thuật. Các chỉ số định lượng như chỉ số h (h-index) và hệ số tác động của tạp chí (impact factor) xoáy sâu vào mức độ phổ biến và sự chú ý. Bản thân các điểm số trở thành tín hiệu trực tiếp cho các học giả khác. Và các chỉ số được đưa vào các thuật toán xếp hạng, ví dụ như các thuật toán tạo nên thứ hạng trang nhất của kết quả tìm kiếm Google Scholar. Rõ ràng, ai đã có lại càng được ban cho nhiều hơn.

Giao phó cho xác suất của máy tính

Ví dụ về Google Scholar là một nửa chặng đường hướng tới những sản phẩm AI Deep Research. Cơ chế thuật toán nào tạo ra mười trích dẫn màu xanh lam là một bí mật được giữ kín. Ngay cả các kỹ sư của Google quản lý công cụ đề xuất phức tạp này cũng không hiểu đầy đủ cách thức hoạt động của nó. Ngược lại, hiệu ứng Matthew kiểu cũ có thể được theo dõi và đo lường; nhiệm vụ là lần theo dấu vết tham khảo do nhà nghiên cứu để lại. Tất cả lợi thế tích lũy đó, bao gồm cả tính chất có quy luật của nó, đều có thể đọc được và do đó có thể được xem xét kỹ lưỡng.

Các sản phẩm tóm tắt và trích dẫn dựa trên AI thì hoàn toàn khó hiểu. Tất cả các bên đều sử dụng các mô hình nền tảng (LLM) để tạo ra các bản tóm tắt kèm theo tài liệu tham khảo, kể các nhà xuất bản học thuật cũng sử dụng các mô hình của OpenAI để khai thác cơ sở dữ liệu độc quyền của họ. Tất nhiên, Anthropic, Google và OpenAI không mời người ngoài kiểm toán các mô hình LLM của mình, nhưng có mời thì cũng như không. Dù đầu ra ít hay nhiều, ở cấp độ nào cũng gần như không thể kiểm tra cấu trúc bên trong và ma trận của các phép toán xác suất cho ra một văn bản ngay ngắn, trật tự. Càng không thể truy ra “nguồn” thực sự mà chúng sử dụng. Từ ”nguồn” mà các LLM nhắc tới khi huấn luyện và truy xuất trong một bể dữ liệu không có từ tương đương nào dễ hiểu đối với con người.

Tất cả các mô hình AI tạo sinh, bằng cách này hay cách khác, đều sử dụng quá khứ để đưa ra dự đoán xác suất về tương lai. Đối với tính năng Deep Research, khi các công cụ này chuyển sang sử dụng tài liệu học thuật, chúng thừa hưởng toàn bộ di sản tệ hại của sự lề hóa có hệ thống. Với mỗi lần đặt cược xác suất vào tài liệu nào sẽ xuất hiện, chúng có khả năng tái hiện những di căn đó. Tuy nhiên, chúng ta sẽ không dễ biết được nó có xảy ra hay không.

Hiệu ứng Matthew thời tiền kỹ thuật số đã góp phần phân tầng khoa học và học thuật, tái tạo một “cấu trúc giai cấp” học thuật thông qua sự phổ biến và tất cả những phần thưởng và hệ lụy đi kèm. Sự bất bình đẳng về cấu trúc của hệ thống (xung quanh chủng tộc và giới tính, ngôn ngữ tiếng Anh và động lực trung tâm-ngoại vi toàn cầu) đều có nguồn gốc và nguyên nhân riêng. Nhưng tất cả đều được chống đỡ bởi động lực của lợi thế tích lũy.

Trong những năm tới, thung lũng Silicon và các nhà xuất bản thương mại lớn có thể sẽ tranh giành quyền khai thác kho tàng tri thức học thuật. Các nhà xuất bản đang tự định hình lại mình thành các công ty phân tích dữ liệu, và họ nghĩ rằng mình đang nắm giữ một mỏ vàng bản quyền. Sẽ có thêm nhiều kịch tính, bao gồm các vụ kiện tụng, thỏa thuận cấp phép và (có thể) các vụ mua bán sáp nhập.

Ở một khía cạnh nào đó, tất cả những sự xáo trộn sắp tới chỉ là màn kịch phụ. Câu chuyện lớn hơn là việc cả hai ngành công nghiệp đều đón nhận các mô hình nền tảng như những công cụ chắt lọc tri thức, một ngành theo đuổi lợi nhuận và ngành kia theo đuổi sự giàu có bất ngờ. Trong số tất cả những lời hứa hẹn được thổi phồng của AI, khả năng tóm tắt của các mô hình LLM gây ấn tượng nhất. Các bài báo được tóm tắt ra trong chóng vánh, đủ tốt, và có kèm theo trích dẫn. Đúng là mô hình vẫn ảo tưởng (hallucinate) và đó là một vấn đề lớn. Nhưng động lực của hiệu ứng Matthew được phân tích trong bài này, trớ trêu thế nào lại phụ thuộc vào các tài liệu tham khảo có thực, và có rất nhiều tài liệu như vậy.

Điểm mấu chốt là các công cụ AI tóm tắt và trích dẫn mang tính trình diễn. Vì sự phổ biến tiếp tay cho sự phổ biến, các công cụ AI có thể hiện thực hóa một thế giới mà chính chúng chỉ đang đơn thuần mô tả. Đúng như OpenAI đã giới thiệu về Deep Reseãch, “khả năng tổng hợp kiến thức là điều kiện tiên quyết để tạo ra kiến thức mới”. Chuyện tổng hợp kiến thức vốn đã khó khăn khi con người còn tự tay tóm tắt. Nếu chúng ta giao phó công việc này cho xác suất tính toán và động cơ lợi nhuận, chúng ta có thể tái tạo, hoặc thậm chí tạo ra một “cấu trúc giai cấp” trầm trọng hơn trong giới học thuật, với tất cả những bất công tích lũy (và hiện đang bị che giấu).

Tác giả: Jefferson Pooley

Jefferson Pooley là Phó Giáo sư tại Khoa Truyền thông Annenberg thuộc Đại học Pennsylvania, đồng thời là đồng giám đốc của mediastudies.press. Ông nghiên cứu về lịch sử khoa học xã hội, truyền thông học thuật, truyền thông xã hội. Danh sách đầy đủ các bài viết của ông có tại jeffpooley.com.

Bài viết gốc: https://blogs.lse.ac.uk/impactofsocialsciences/2026/05/19/the-matthew-effect-in-ai-summary/

Về tỉ vũ trụ cạnh thế giới loài người 🔭

AI học thuật và hiệu ứng Matthew: cho kẻ có, không cho kẻ khó (bài dịch)

Hiệu ứng Matthew trong giới học thuật (dành cho người)

Có quá nhiều thứ để mà biết hết

Giao phó cho xác suất của máy tính

Like this:

Leave a Reply Cancel reply

CHIA SẺ BÀI VIẾT TRÊN Share this content

Hiệu ứng Matthew trong giới học thuật (dành cho người)

Có quá nhiều thứ để mà biết hết

Giao phó cho xác suất của máy tính

Like this:

Leave a Reply Cancel reply

Share this content