TRANG THÔNG TIN ĐIỆN TỬ TỔNG HỢP

Meta, Google và Scale AI: Cuộc đua dữ liệu trong ngành công nghiệp AI

Trong bối cảnh trí tuệ nhân tạo (AI) đang định hình lại tương lai công nghệ, dữ liệu chất lượng cao trở thành "nhiên liệu" không thể thiếu để huấn luyện các mô hình AI tiên tiến. Vào ngày 13 tháng 6 năm 2025, một sự kiện quan trọng đã làm rung chuyển ngành công nghiệp AI: Meta, gã khổng lồ mạng xã hội, tuyên bố đầu tư 49% cổ phần vào Scale AI, một công ty chuyên cung cấp dữ liệu được gắn nhãn bởi con người. Thương vụ này không chỉ nâng định giá của Scale AI lên 29 tỷ USD mà còn khiến Google, khách hàng lớn nhất của Scale AI, quyết định chấm dứt hợp tác. Sự kiện này không chỉ đánh dấu một bước ngoặt trong quan hệ đối tác giữa các công ty công nghệ lớn mà còn mở ra một cuộc cạnh tranh khốc liệt trong lĩnh vực dữ liệu AI. Bài viết này sẽ phân tích sâu sắc tác động của thương vụ Meta-Scale AI, phản ứng của Google và các công ty khác, cũng như ý nghĩa đối với ngành công nghiệp AI.

Bối cảnh thương vụ Meta và Scale AI

 

Thương vụ Meta đầu tư vào Scale AI là một bước đi chiến lược nhằm củng cố vị thế của Meta trong cuộc đua AI. Với khoản đầu tư 14,8 tỷ USD để sở hữu 49% cổ phần, Meta đã đẩy định giá của Scale AI từ 14 tỷ USD lên 29 tỷ USD, khẳng định tầm quan trọng của công ty này trong chuỗi cung ứng dữ liệu AI. Scale AI, được thành lập vào năm 2016, chuyên cung cấp dữ liệu được gắn nhãn bởi con người, một yếu tố cốt lõi để huấn luyện các mô hình AI như Gemini của Google, ChatGPT của OpenAI, hay Llama 4 của Meta. Năm 2024, Scale AI đạt doanh thu 870 triệu USD, trong đó Google đóng góp khoảng 150 triệu USD cho các dịch vụ dữ liệu.

Điểm đáng chú ý của thương vụ là việc CEO của Scale AI, Alexandr Wang, sẽ chuyển sang Meta để dẫn dắt các nỗ lực phát triển AI. Điều này cho thấy Meta không chỉ muốn sở hữu cổ phần mà còn nhắm đến nhân tài và chuyên môn của Scale AI để thúc đẩy tham vọng về trí tuệ nhân tạo tổng quát (AGI). Tuy nhiên, thương vụ này cũng gây ra những lo ngại về tính bảo mật và trung lập của dữ liệu, đặc biệt đối với các đối thủ cạnh tranh của Meta.

Phản ứng của Google và các công ty công nghệ khác

Google chấm dứt hợp tác với Scale AI

Google, khách hàng lớn nhất của Scale AI, dự kiến chi 200 triệu USD trong năm 2025 để sử dụng dữ liệu được gắn nhãn bởi Scale AI. Tuy nhiên, ngay sau khi Meta công bố thương vụ, Google đã quyết định cắt đứt quan hệ và tìm kiếm các nhà cung cấp dữ liệu thay thế. Lý do chính là lo ngại rằng Meta, với 49% cổ phần tại Scale AI, có thể tiếp cận các dữ liệu độc quyền và lộ trình phát triển AI của Google, bao gồm cả thông tin về mô hình Gemini – đối thủ trực tiếp của ChatGPT.

Google đã bắt đầu đàm phán với các đối thủ của Scale AI, như Labelbox và Handshake, để chuyển giao khối lượng công việc. Quá trình này có thể diễn ra nhanh chóng do cấu trúc linh hoạt của các hợp đồng gắn nhãn dữ liệu. Động thái này không chỉ phản ánh sự thận trọng của Google trong việc bảo vệ dữ liệu mà còn cho thấy xu hướng đa dạng hóa chuỗi cung ứng dữ liệu, vốn đã được Google triển khai từ hơn một năm trước.

Các công ty khác rút lui

Không chỉ Google, các công ty công nghệ lớn khác cũng có động thái tương tự. Microsoft và xAI của Elon Musk đang xem xét rút khỏi Scale AI, trong khi OpenAI đã giảm hợp tác từ vài tháng trước. Tuy nhiên, OpenAI vẫn duy trì quan hệ với Scale AI như một trong nhiều nhà cung cấp dữ liệu, theo tuyên bố của CFO công ty này. Sự rút lui đồng loạt của các "ông lớn" công nghệ cho thấy mối lo ngại chung: làm việc với Scale AI trong bối cảnh Meta sở hữu cổ phần lớn có thể làm rò rỉ thông tin nhạy cảm về chiến lược và công nghệ của họ.

Hệ quả đối với Scale AI

Sự rút lui của các khách hàng lớn như Google, Microsoft và xAI là một thách thức lớn đối với Scale AI, vì doanh thu của công ty chủ yếu đến từ một số đối tác chính. Mặc dù Scale AI vẫn duy trì hoạt động với các khách hàng doanh nghiệp (như các công ty xe tự lái) và chính phủ, việc mất các "ông lớn" công nghệ có thể gây tổn thất nghiêm trọng. Tuy nhiên, Scale AI khẳng định rằng hoạt động kinh doanh của họ vẫn mạnh mẽ và cam kết bảo vệ dữ liệu khách hàng.

Tác động đến ngành công nghiệp AI

Vai trò của dữ liệu được gắn nhãn

Dữ liệu được gắn nhãn bởi con người là yếu tố then chốt trong việc huấn luyện các mô hình AI tiên tiến. Scale AI sử dụng mạng lưới các chuyên gia, từ nhà sử học đến nhà khoa học với bằng tiến sĩ, để gắn nhãn các tập dữ liệu phức tạp. Những dữ liệu này được sử dụng để "hậu huấn luyện" (post-train) các mô hình AI, giúp chúng trở nên thông minh hơn. Khi các mô hình AI ngày càng phức tạp, nhu cầu về dữ liệu chất lượng cao tăng mạnh, với chi phí cho một lần gắn nhãn có thể lên tới 100 USD.

Cơ hội cho các đối thủ của Scale AI

Thương vụ Meta-Scale AI đã tạo cơ hội cho các đối thủ của Scale AI. Labelbox, một công ty cạnh tranh, dự kiến sẽ thu về hàng trăm triệu USD doanh thu mới từ các khách hàng rời bỏ Scale AI. Handshake, một startup tập trung vào mạng lưới các chuyên gia có bằng tiến sĩ, báo cáo nhu cầu tăng gấp ba ngay sau khi thương vụ được công bố. Turing, một đối thủ khác, nhấn mạnh rằng tính trung lập của nhà cung cấp dữ liệu giờ đây là yếu tố không thể thiếu đối với các phòng thí nghiệm AI.

Xu hướng tự phát triển dữ liệu nội bộ

Để bảo vệ dữ liệu nhạy cảm, nhiều công ty AI đang chuyển sang xây dựng đội ngũ gắn nhãn dữ liệu nội bộ. Mercor, một startup chuyên hỗ trợ tuyển dụng và kiểm tra ứng viên tự động, đang giúp các công ty AI mở rộng quy mô gắn nhãn dữ liệu một cách nhanh chóng. Xu hướng này không chỉ đảm bảo tính bảo mật mà còn cho phép các công ty kiểm soát tốt hơn chất lượng dữ liệu.

Ý nghĩa chiến lược của thương vụ

Đối với Meta

Thương vụ với Scale AI giúp Meta củng cố nguồn lực dữ liệu và nhân tài, từ đó thúc đẩy tham vọng cạnh tranh với Google, OpenAI và Microsoft trong cuộc đua AI. Việc đưa Alexandr Wang vào đội ngũ lãnh đạo AI của Meta là một bước đi quan trọng, đặc biệt khi Llama 4 – mô hình ngôn ngữ lớn của Meta – bị đánh giá là chưa đáp ứng kỳ vọng về hiệu suất. Với dữ liệu chất lượng cao từ Scale AI, Meta có thể cải thiện các mô hình AI của mình và giành lại vị thế trong ngành.

Đối với Google

Google đang đẩy nhanh quá trình đa dạng hóa chuỗi cung ứng dữ liệu để đảm bảo tính bảo mật và trung lập. Việc chuyển sang các nhà cung cấp khác như Labelbox hay Handshake không chỉ giúp Google giảm rủi ro mà còn tạo cơ hội cho các công ty nhỏ hơn trong ngành. Tuy nhiên, Google cần nhanh chóng thích nghi để duy trì lợi thế cạnh tranh trong việc phát triển các mô hình AI như Gemini.

Đối với ngành AI

Thương vụ Meta-Scale AI đánh dấu một bước ngoặt trong ngành công nghiệp AI, nhấn mạnh tầm quan trọng của tính trung lập trong chuỗi cung ứng dữ liệu. Các công ty AI giờ đây phải cân nhắc kỹ lưỡng khi chọn đối tác dữ liệu, trong khi các nhà cung cấp dịch vụ gắn nhãn dữ liệu phải cạnh tranh khốc liệt hơn để giành thị phần. Sự kiện này cũng thúc đẩy xu hướng tự phát triển dữ liệu nội bộ, làm thay đổi cách các công ty AI vận hành.

Thương vụ Meta đầu tư 49% cổ phần vào Scale AI đã tạo ra một làn sóng thay đổi trong ngành công nghiệp AI. Google, Microsoft và xAI rút lui khỏi Scale AI, lo ngại về tính bảo mật dữ liệu, trong khi các đối thủ như Labelbox, Handshake và Turing tận dụng cơ hội để mở rộng thị phần. Trong bối cảnh dữ liệu được gắn nhãn trở thành yếu tố sống còn cho các mô hình AI tiên tiến, các công ty công nghệ buộc phải điều chỉnh chiến lược để bảo vệ lợi thế cạnh tranh. Scale AI, dù đối mặt với thách thức mất khách hàng lớn, vẫn có cơ hội phát triển với các đối tác không cạnh tranh trực tiếp với Meta. Cuộc đua dữ liệu trong ngành AI đang ngày càng gay gắt, và những động thái chiến lược như thương vụ này sẽ tiếp tục định hình tương lai của trí tuệ nhân tạo.

TH (phapluatxahoi.kinhtedothi.vn)

Hình ảnh Tạ Quang Vinh

Tạ Quang Vinh

Đang cập nhật...

Xem gì ?

Bạn quan tâm