Tiêu đề gốc: Ghi chú từ bên trong phòng thí nghiệm AI của Trung Quốc
Tác giả gốc: Nathan Lambert
Biên soạn bởi: Peggy, BlockBeats

Lưu ý của biên tập viên: Các phòng thí nghiệm AI của Trung Quốc đang trở thành một thế lực ngày càng khó bị bỏ qua trong cuộc cạnh tranh toàn cầu về các mô hình lớn. Ưu điểm của họ không chỉ là số lượng nhân tài lớn, kỹ thuật mạnh và khả năng lặp lại nhanh mà còn đến từ phương pháp tổ chức rất thực tế: ít nói về các khái niệm và tạo ra nhiều mô hình hơn; nhấn mạnh ít hơn vào các ngôi sao cá nhân và nhiều hơn vào việc thực hiện nhóm; ít phụ thuộc hơn vào các dịch vụ bên ngoài và ưu tiên tự mình làm chủ nền tảng công nghệ cốt lõi.

Sau khi đến thăm một số phòng thí nghiệm AI hàng đầu của Trung Quốc, tác giả bài viết này, Nathan Lambert, nhận thấy rằng hệ sinh thái AI của Trung Quốc không hoàn toàn giống với hệ sinh thái AI của Hoa Kỳ. Hoa Kỳ chú ý nhiều hơn đến các mô hình ban đầu, đầu tư vốn và ảnh hưởng cá nhân của các nhà khoa học hàng đầu; Trung Quốc giỏi hơn trong việc bắt kịp nhanh chóng các hướng đi hiện có, nhanh chóng đẩy mạnh khả năng mô hình của mình lên hàng đầu thông qua nguồn mở, tối ưu hóa kỹ thuật và sự đầu tư của một số lượng lớn các nhà nghiên cứu trẻ.

Điều đáng chú ý nhất không phải là liệu AI của Trung Quốc có vượt qua Hoa Kỳ hay không, mà là hai con đường phát triển khác nhau đang hình thành: Hoa Kỳ giống một cuộc cạnh tranh tiên tiến được thúc đẩy bởi các phòng thí nghiệm vốn và ngôi sao, trong khi Trung Quốc giống một cuộc cạnh tranh công nghiệp được thúc đẩy bởi năng lực kỹ thuật, hệ sinh thái nguồn mở và nhận thức tự chủ về công nghệ.

Điều này có nghĩa là trong tương lai, cuộc cạnh tranh AI sẽ không chỉ là cuộc chiến giành thứ hạng mô hình mà còn là cuộc chiến về năng lực tổ chức, hệ sinh thái của nhà phát triển và khả năng thực thi công nghiệp. Sự thay đổi thực sự trong AI của Trung Quốc là nước này không còn chỉ sao chép Thung lũng Silicon mà đang tham gia vào lĩnh vực tiên phong toàn cầu theo cách riêng của mình.

Sau đây là nội dung gốc:

Ngồi trên chuyến tàu cao tốc mới từ Hàng Châu đến Thượng Hải, tôi nhìn ra ngoài cửa sổ và thấy những rặng núi nhấp nhô rải rác với những tua bin gió, in bóng dưới ánh mặt trời lặn. Những ngọn núi làm nền, trước mặt bạn là khung cảnh những cánh đồng rộng lớn đan xen với những tòa nhà cao tầng.

Tôi trở về từ Trung Quốc với lòng khiêm tốn vô cùng. Thật là một trải nghiệm rất ấm áp và nhân văn khi đến một nơi xa lạ và được chào đón nồng nhiệt như vậy. Tôi may mắn được gặp nhiều người trong hệ sinh thái AI mà tôi chỉ biết từ xa; và những nụ cười rạng rỡ cũng như sự nhiệt tình mà họ chào đón tôi khiến tôi một lần nữa nhận ra rằng công việc của tôi cũng như toàn bộ hệ sinh thái AI đều mang tính toàn cầu.

Tâm lý của các nhà nghiên cứu Trung Quốc

Các công ty Trung Quốc đang xây dựng mô hình ngôn ngữ có thể nói là rất phù hợp để trở thành những “kẻ đi sau nhanh” của công nghệ này. Chúng được xây dựng dựa trên truyền thống văn hóa lâu đời về giáo dục và làm việc của Trung Quốc, nhưng cũng có cách tiếp cận xây dựng công ty công nghệ hơi khác so với phương Tây.

Nếu bạn chỉ nhìn vào kết quả đầu ra, tức là các mô hình mới nhất và lớn nhất cũng như quy trình làm việc thông minh được các mô hình này hỗ trợ; rồi nhìn vào các yếu tố đầu vào như nhà khoa học xuất sắc, dữ liệu quy mô lớn, tài nguyên máy tính tăng tốc, thì các phòng thí nghiệm của Trung Quốc và các phòng thí nghiệm của Mỹ nhìn chung giống nhau. Sự khác biệt thực sự lâu dài xuất hiện ở cách các yếu tố này được tổ chức và định hình.

Tôi luôn tin rằng một lý do khiến các phòng thí nghiệm Trung Quốc rất giỏi trong việc bắt kịp và bám sát biên giới là vì họ phù hợp về mặt văn hóa với nhiệm vụ. Nhưng trước khi giao tiếp trực tiếp với mọi người, tôi cảm thấy mình không thích hợp để gán trực giác này cho một số ảnh hưởng quan trọng. Nhiều ý tưởng của tôi trở nên rõ ràng hơn sau khi nói chuyện với nhiều nhà khoa học xuất sắc, khiêm tốn và cởi mở tại các phòng thí nghiệm chính của Trung Quốc.

Việc xây dựng các mô hình ngôn ngữ lớn tốt nhất hiện nay phụ thuộc phần lớn vào công việc tỉ mỉ trong toàn bộ hệ thống công nghệ: từ dữ liệu, đến các chi tiết kiến trúc cho đến việc triển khai các thuật toán học tăng cường. Mọi khía cạnh của mô hình đều có thể mang lại một số cải tiến và cách kết hợp những cải tiến này là một quá trình phức tạp. Trong quá trình này, công việc của một số cá nhân rất thông minh có thể phải được đặt sang một bên để cho phép mô hình tổng thể được tối đa hóa trong tối ưu hóa đa mục tiêu.

Các nhà nghiên cứu Mỹ rõ ràng rất giỏi trong việc giải quyết các vấn đề của từng thành phần riêng lẻ, nhưng Hoa Kỳ cũng có văn hóa “tự mình lên tiếng”. Là một nhà khoa học, bạn có xu hướng thành công hơn khi tích cực tìm kiếm sự chú ý cho công việc của mình; và văn hóa đương đại cũng đang thúc đẩy một con đường mới để nổi tiếng, đó là trở thành “nhà khoa học AI hàng đầu”. Điều này tạo ra xung đột trực tiếp.

Có tin đồn rộng rãi rằng tổ chức Llama sụp đổ do áp lực chính trị sau khi những yêu cầu về lợi ích này được đưa vào tổ chức có thứ bậc. Tôi cũng đã nghe từ các phòng thí nghiệm khác rằng đôi khi cần phải "xoa dịu" một nhà nghiên cứu hàng đầu để họ ngừng phàn nàn rằng ý tưởng của họ không được đưa vào mô hình cuối cùng. Dù điều này có hoàn toàn đúng hay không thì hàm ý vẫn rất rõ ràng: cái tôi và mong muốn thăng tiến nghề nghiệp thực sự có thể cản trở việc xây dựng những mô hình tốt nhất có thể. Ngay cả một sự khác biệt nhỏ về phương hướng trong văn hóa này giữa Hoa Kỳ và Trung Quốc cũng có thể có tác động đáng kể đến sản lượng cuối cùng.

Một phần của sự khác biệt liên quan đến việc ai đang xây dựng những mô hình này ở Trung Quốc. Trong tất cả các phòng thí nghiệm, một thực tế rất rõ ràng là phần lớn những người đóng góp cốt lõi là những sinh viên vẫn đang đi học. Những phòng thí nghiệm này còn khá non trẻ, điều này làm tôi nhớ đến cách chúng tôi tổ chức tại Ai2: học sinh được đối xử như những người ngang hàng và được hòa nhập trực tiếp vào nhóm mô hình ngôn ngữ lớn hơn.

Điều này rất khác biệt so với các phòng thí nghiệm hàng đầu ở Hoa Kỳ. Ở Mỹ, các công ty như OpenAI, Anthropic, Cursor, v.v. hoàn toàn không cung cấp chương trình thực tập. Các công ty khác như Google trên danh nghĩa sẽ cung cấp các chương trình thực tập liên quan đến Song Tử, nhưng nhiều người lo lắng liệu công việc thực tập của họ có bị tách biệt khỏi công việc cốt lõi thực sự của họ hay không.

Tóm lại, sự khác biệt nhỏ về văn hóa này có thể cải thiện khả năng xây dựng mô hình theo những cách sau: mọi người sẵn sàng làm những công việc kém hấp dẫn hơn để cải thiện mô hình cuối cùng; những người mới bắt đầu tham gia xây dựng AI có thể không bị ảnh hưởng bởi các vòng chu kỳ cường điệu AI trước đó và do đó có thể thích ứng với các phương pháp công nghệ hiện đại mới nhanh hơn. Trên thực tế, một nhà khoa học Trung Quốc mà tôi đã nói chuyện đã thấy rất rõ đây là một lợi thế; khả năng tự nhận thức thấp hơn làm cho cơ cấu tổ chức dễ dàng mở rộng quy mô hơn vì có ít người cố gắng "lừa đảo hệ thống" hơn; nguồn nhân tài lớn rất phù hợp để giải quyết các vấn đề đã có bằng chứng về khái niệm ở nơi khác, v.v.

Khả năng có lợi hơn cho việc xây dựng các mô hình ngôn ngữ hiện tại này trái ngược với khuôn mẫu đã biết: Mọi người thường tin rằng các nhà nghiên cứu Trung Quốc ít có khả năng tạo ra loại nghiên cứu học thuật "từ 0 đến 1" sáng tạo hơn để có thể mở ra các lĩnh vực mới.

Trong một số chuyến thăm phòng thí nghiệm mang tính học thuật hơn trong chuyến đi này, nhiều nhà lãnh đạo đã nói về cách họ nuôi dưỡng nền văn hóa nghiên cứu đầy tham vọng hơn này. Đồng thời, một số nhà lãnh đạo công nghệ mà chúng tôi đã nói chuyện cũng nghi ngờ rằng việc định hình lại cách thức thực hiện khoa học này có khả thi trong thời gian ngắn hay không, bởi vì nó đòi hỏi phải thiết kế lại hệ thống giáo dục và khuyến khích vốn quá lớn để có thể xảy ra trong tình trạng cân bằng kinh tế hiện tại.

Nền văn hóa này dường như đang đào tạo ra một nhóm sinh viên, kỹ sư rất giỏi “trò chơi xây dựng mô hình ngôn ngữ lớn”. Tất nhiên, có rất nhiều trong số họ.

Những sinh viên này nói với tôi rằng tình trạng chảy máu chất xám tương tự như ở Hoa Kỳ đang xảy ra ở Trung Quốc: Nhiều người trước đây coi con đường học thuật hiện dự định ở lại ngành công nghiệp. Một trong những lời thú vị nhất đến từ một nhà nghiên cứu ban đầu muốn trở thành giáo sư. Anh nói rằng anh muốn trở thành giáo sư vì muốn gần gũi với hệ thống giáo dục; nhưng sau đó ông lại nhận xét rằng giáo dục đã được giải quyết bằng các mô hình ngôn ngữ lớn - "Sao học sinh vẫn tìm đến tôi để trò chuyện!"

Học sinh bước vào lĩnh vực mô hình ngôn ngữ lớn với con mắt mới mẻ là một lợi thế. Trong vài năm qua, chúng tôi đã thấy các mô hình chính cho các mô hình ngôn ngữ lớn tiếp tục thay đổi: từ mở rộng MoE đến mở rộng học tập tăng cường đến các tác nhân hỗ trợ. Để thực hiện tốt bất kỳ điều nào trong số này, đòi hỏi phải tiếp thu rất nhiều thông tin cơ bản cực kỳ nhanh chóng, cả từ tài liệu rộng hơn và từ bên trong hệ thống công nghệ trong công ty của bạn.

Học sinh đã quen làm những việc này và sẵn sàng khiêm tốn từ bỏ mọi giả định về những gì nên làm. Họ lao vào và đầu tư cả cuộc đời mình vào đó chỉ để có cơ hội cải thiện mô hình.

Các sinh viên cũng bộc trực một cách đáng ngạc nhiên và không có những cuộc tán gẫu triết học có thể khiến các nhà khoa học mất tập trung. Khi tôi hỏi họ nghĩ gì về tác động kinh tế hoặc rủi ro xã hội lâu dài của mô hình, có rất ít nhà nghiên cứu Trung Quốc có quan điểm sâu sắc và muốn tác động đến những vấn đề này. Họ coi vai trò của mình là xây dựng mô hình tốt nhất có thể.

Sự khác biệt rất tinh tế và dễ dàng bị phủ nhận. Nhưng điều đó được cảm nhận rõ ràng nhất khi bạn trò chuyện lâu với một nhà nghiên cứu thanh lịch, thông minh và có thể nói tiếng Anh rõ ràng: khi bạn hỏi một số câu hỏi mang tính triết lý hơn về AI, những câu hỏi cơ bản đó lơ lửng trong không khí và người kia đơn giản tỏ ra bối rối. Đối với họ, đây là một lỗi danh mục.

Một nhà nghiên cứu thậm chí còn trích dẫn nhận định nổi tiếng của Dan Wang: So với Hoa Kỳ, nơi bị thống trị bởi các luật sư, thì Trung Quốc được cai trị bởi các kỹ sư. Khi nói về những vấn đề này, ông đã sử dụng phép so sánh này để nhấn mạnh mong muốn xây dựng của họ. Ở Trung Quốc, không có con đường mang tính hệ thống nào để nuôi dưỡng sức mạnh ngôi sao của các nhà khoa học Trung Quốc như cách mà các podcast siêu chính thống như Dwarkesh hay Lex đã làm.

Tôi đã cố gắng kêu gọi các nhà khoa học Trung Quốc bình luận về sự bất ổn kinh tế trong tương lai do AI gây ra, các vấn đề vượt quá khả năng AGI đơn giản hoặc các cuộc tranh luận về đạo đức về cách các mô hình nên hành xử; những câu hỏi này cuối cùng đã giúp tôi hiểu được lai lịch và trình độ học vấn của những nhà khoa học này (đã chỉnh sửa 1). Họ cực kỳ tận tâm với công việc của mình, nhưng họ lớn lên trong một hệ thống không khuyến khích thảo luận và bày tỏ về cách tổ chức xã hội và cách xã hội nên thay đổi.

Nhìn từ xa, đặc biệt là Bắc Kinh, nó có cảm giác rất giống Vùng Vịnh: một phòng thí nghiệm cạnh tranh, có thể chỉ cách đó vài phút đi bộ hoặc đi taxi. Sau khi xuống máy bay, tôi ghé qua khuôn viên Alibaba Bắc Kinh trên đường về khách sạn. Trong 36 giờ tiếp theo, chúng tôi đã đến Zhipu AI, Dark Side of the Moon, Đại học Thanh Hoa, Meituan, Xiaomi và 01.ai.

Việc đưa Didi đi du lịch Trung Quốc rất thuận tiện. Nếu chọn mẫu XL, bạn sẽ thường được giao một chiếc xe tải nhỏ chạy điện có ghế mát-xa. Chúng tôi đã hỏi các nhà nghiên cứu về cuộc chiến giành nhân tài và họ nói rằng nó rất giống với những gì chúng tôi đang trải qua ở Hoa Kỳ. Việc các nhà nghiên cứu thay đổi công việc là điều bình thường và nơi mọi người chọn đi phần lớn phụ thuộc vào nơi có bầu không khí tốt nhất vào lúc này.

Ở Trung Quốc, cộng đồng mô hình ngôn ngữ lớn có cảm giác giống một hệ sinh thái hơn là các bộ tộc gây chiến. Trong nhiều cuộc trò chuyện riêng tư, tất cả những gì tôi nghe được hầu như chỉ là sự tôn trọng dành cho đồng nghiệp của mình. Tất cả các phòng thí nghiệm Trung Quốc đều sợ ByteDance và mô hình túi đậu phổ biến của nó vì đây là phòng thí nghiệm nguồn đóng tiên tiến duy nhất ở Trung Quốc. Đồng thời, tất cả các phòng thí nghiệm đều tôn trọng DeepSeek là phòng thí nghiệm có hứng thú nghiên cứu nhất ở cấp độ thực thi. Ở Hoa Kỳ, khi bạn có những tương tác không chính thức với các thành viên trong phòng thí nghiệm, tia lửa thường bay rất nhanh.

Điều khiến tôi ấn tượng nhất về sự khiêm tốn của các nhà nghiên cứu Trung Quốc là họ thường nhún vai ở cấp độ doanh nghiệp và nói rằng đó không phải vấn đề của họ. Ở Hoa Kỳ, dường như mọi người đều bị ám ảnh bởi các xu hướng khác nhau của ngành sinh thái, từ người bán dữ liệu, sức mạnh tính toán đến tài chính.

Sự khác biệt và tương đồng giữa ngành công nghiệp AI của Trung Quốc và các phòng thí nghiệm phương Tây

Lý do tại sao việc xây dựng một mô hình AI ngày nay lại thú vị đến vậy là vì nó không còn chỉ là việc tập hợp một nhóm các nhà nghiên cứu xuất sắc lại với nhau trong cùng một tòa nhà để tạo nên một kỳ tích kỹ thuật. Trước đây nó giống như vậy hơn, nhưng để duy trì hoạt động kinh doanh AI, các mô hình ngôn ngữ lớn đang trở thành sự kết hợp: đó là về việc xây dựng, triển khai, cấp vốn và thúc đẩy việc áp dụng sáng tạo này.

Các công ty AI hàng đầu tồn tại trong hệ sinh thái phức tạp. Các hệ sinh thái này cung cấp vốn, sức mạnh tính toán, dữ liệu, v.v. để tiếp tục thúc đẩy giới hạn phát triển.

Trong hệ sinh thái phương Tây, việc tích hợp nhiều yếu tố đầu vào cần thiết để tạo và duy trì các mô hình ngôn ngữ lớn đã được khái niệm hóa và lập bản đồ tương đối tốt. Anthropic và OpenAI là những ví dụ điển hình. Vì vậy, nếu chúng ta có thể tìm thấy những khác biệt rõ ràng trong cách các phòng thí nghiệm Trung Quốc nghĩ về những vấn đề này, thì điều đó có thể cho chúng ta biết về những khác biệt có ý nghĩa mà các công ty khác nhau có thể đặt cược vào trong tương lai. Tất nhiên, những tương lai này cũng sẽ bị ảnh hưởng mạnh mẽ bởi những hạn chế về tài chính và/hoặc sức mạnh tính toán.

Tôi đã tổng hợp một số lợi ích lớn nhất ở "cấp độ ngành AI" sau khi liên lạc với các phòng thí nghiệm này như sau:

Đầu tiên, có những dấu hiệu ban đầu về nhu cầu AI trong nước.
Có một giả thuyết được thảo luận rộng rãi rằng thị trường AI Trung Quốc sẽ nhỏ hơn vì các công ty Trung Quốc nhìn chung không sẵn lòng trả tiền cho phần mềm và do đó sẽ không bao giờ có thể mở khóa thị trường suy luận đủ lớn để hỗ trợ các phòng thí nghiệm.

Nhưng nhận định này chỉ áp dụng cho các khoản chi tiêu cho phần mềm tương ứng với hệ sinh thái SaaS. Hệ sinh thái SaaS luôn có quy mô nhỏ trong lịch sử Trung Quốc. Mặt khác, Trung Quốc rõ ràng vẫn có một thị trường đám mây khổng lồ.

Một câu hỏi quan trọng và chưa có câu trả lời là: Liệu chi tiêu của các công ty Trung Quốc cho AI sẽ giống thị trường SaaS, quy mô nhỏ hơn, hay giống thị trường đám mây, vốn là chi tiêu cơ bản hơn. Vấn đề này cũng đang được thảo luận trong các phòng thí nghiệm của Trung Quốc. Nhìn chung, tôi có cảm giác như AI đang tiến gần hơn đến thị trường đám mây và không ai thực sự lo lắng rằng thị trường hình thành xung quanh các công cụ mới sẽ không phát triển.

Thứ hai, hầu hết các nhà phát triển đều chịu ảnh hưởng sâu sắc từ Claude.
Mặc dù Claude trên danh nghĩa bị cấm ở Trung Quốc, nhưng hầu hết các nhà phát triển AI ở Trung Quốc đều bị ám ảnh bởi Claude và việc nó đã thay đổi cách họ xây dựng phần mềm như thế nào. Chỉ vì trước đây Trung Quốc không muốn mua phần mềm, không có nghĩa là tôi không nghĩ rằng sẽ có một đợt tăng trưởng nhu cầu suy luận lớn ở Trung Quốc.

Kỹ thuật viên Trung Quốc rất thực dụng, khiêm tốn và năng động. Điều này mang lại cho tôi cảm giác mạnh mẽ hơn bất kỳ thói quen “mua phần mềm không tốn tiền” trước đây.

Một số nhà nghiên cứu Trung Quốc sẽ đề cập rằng họ sử dụng các công cụ riêng của họ để xây dựng, chẳng hạn như các công cụ dòng lệnh của Kimi hoặc GLM, nhưng tất cả sẽ đề cập rằng họ sử dụng Claude. Đáng ngạc nhiên là có rất ít người đề cập đến Codex, codex dường như đang nhanh chóng trở nên phổ biến ở Vùng Vịnh.

Thứ ba, các công ty Trung Quốc có tâm lý sở hữu công nghệ.
Văn hóa Trung Quốc đang được kết hợp với một cỗ máy kinh tế đang bùng nổ, tạo ra một số kết quả khó lường. Một cảm giác sâu sắc mà tôi để lại là số lượng lớn các mô hình AI phản ánh sự cân bằng thực dụng của nhiều công ty công nghệ tại đây. Không có kế hoạch tổng thể.

Ngành công nghiệp này được xác định bởi sự tôn trọng dành cho ByteDance và Alibaba. Họ là những công ty lớn được kỳ vọng sẽ giành được nhiều thị trường bằng nguồn lực hùng mạnh của mình. DeepSeek là một công ty dẫn đầu về công nghệ được kính trọng, nhưng còn lâu mới dẫn đầu thị trường. Họ đặt ra phương hướng nhưng không có cơ cấu để giành thị trường về mặt kinh tế.

Điều này khiến các công ty như Meituan hay Ant Group phải rời bỏ. Người phương Tây có thể ngạc nhiên tại sao họ lại xây dựng những mô hình này. Nhưng trên thực tế, rõ ràng họ coi các mô hình ngôn ngữ lớn là cốt lõi của các sản phẩm công nghệ tương lai nên cần một nền tảng vững chắc.

Khi họ tinh chỉnh một mô hình chung mạnh mẽ, phản hồi từ cộng đồng nguồn mở về mô hình này sẽ giúp công nghệ của họ mạnh mẽ hơn, đồng thời họ cũng có thể giữ lại các phiên bản tinh chỉnh nội bộ cho sản phẩm của riêng mình. Tâm lý "mở đầu tiên" trong ngành này phần lớn được xác định bởi chủ nghĩa thực dụng: nó giúp các mô hình nhận được phản hồi mạnh mẽ, mang lại lợi ích cho cộng đồng nguồn mở và trao quyền cho sứ mệnh của chính họ.

Thứ tư, sự hỗ trợ của chính phủ là có thật, nhưng quy mô của nó không rõ ràng.
Người ta thường khẳng định rằng chính phủ Trung Quốc đang tích cực giúp đỡ mở ra các cuộc thi mô hình ngôn ngữ lớn. Nhưng đây là một hệ thống chính quyền tương đối phi tập trung bao gồm nhiều cấp và mỗi cấp không có hướng dẫn vận hành rõ ràng về những gì cần làm.

Các khu dân cư khác nhau ở Bắc Kinh sẽ cạnh tranh để thu hút các công ty công nghệ đặt văn phòng của họ ở đó. Sự "trợ giúp" dành cho các công ty này gần như chắc chắn sẽ bao gồm việc loại bỏ quan liêu khỏi các quy trình quan liêu như cấp phép. Nhưng điều này có thể giúp được bao xa? Các cấp chính quyền khác nhau có thể giúp thu hút nhân tài không? Họ có thể giúp buôn lậu chip không?

Trong suốt cuộc phỏng vấn, thực sự có rất nhiều đề cập đến sự quan tâm hoặc trợ giúp của chính phủ, nhưng thông tin không đủ để tôi báo cáo chi tiết một cách quyết đoán, cũng như không đủ để tôi hình thành một thế giới quan tự tin về chính xác cách chính phủ có thể thay đổi quỹ đạo phát triển AI của Trung Quốc.

Tất nhiên, hoàn toàn không có dấu hiệu nào cho thấy cấp cao nhất của chính phủ Trung Quốc đang ảnh hưởng đến bất kỳ quyết định kỹ thuật nào đối với mô hình.

Thứ năm, ngành dữ liệu kém phát triển hơn nhiều so với phương Tây.
Trước đây chúng tôi đã nghe nói rằng Anthropic hoặc OpenAI sẽ chi hơn 10 triệu đô la cho một môi trường duy nhất và các khoản chi tích lũy để nâng cao giới hạn của học tập tăng cường lên tới hàng trăm triệu đô la mỗi năm. Vì vậy, chúng tôi tò mò muốn biết liệu các phòng thí nghiệm Trung Quốc có mua môi trường tương tự từ các công ty Hoa Kỳ hay không, hay liệu có một hệ sinh thái nội địa tương tự hỗ trợ họ hay không.

Câu trả lời không phải là "không có ngành dữ liệu" theo nghĩa hoàn chỉnh, mà dựa trên kinh nghiệm của họ, chất lượng của ngành dữ liệu tương đối kém, vì vậy trong nhiều trường hợp, tốt hơn là nên xây dựng môi trường hoặc dữ liệu nội bộ. Bản thân các nhà nghiên cứu sẽ dành nhiều thời gian để tạo ra môi trường đào tạo học tập tăng cường và các công ty lớn hơn như ByteDance và Alibaba có thể có các nhóm chú thích dữ liệu nội bộ để hỗ trợ việc này. Tất cả điều này phản ánh tâm lý “xây dựng thay vì mua” đã nói ở trên.

Thứ sáu, mong muốn có thêm chip NVIDIA rất mạnh mẽ.
Sức mạnh tính toán của NVIDIA là tiêu chuẩn vàng cho việc đào tạo và sự tiến bộ của mọi người bị hạn chế do không có thêm sức mạnh tính toán. Nếu có đủ nguồn cung, hiển nhiên họ sẽ mua. Các máy gia tốc khác, bao gồm nhưng không giới hạn ở Huawei, đã nhận được những đánh giá tích cực về khả năng suy luận. Vô số phòng thí nghiệm có quyền truy cập vào chip Huawei.

Những điểm này vẽ nên một bức tranh rất khác về hệ sinh thái AI. Nếu chúng ta nhanh chóng áp dụng phương pháp vận hành của các phòng thí nghiệm phương Tây cho các đối tác Trung Quốc thì thường sẽ dẫn đến sai sót về phân loại. Câu hỏi quan trọng là liệu các hệ sinh thái khác nhau này có tạo ra các loại mô hình khác nhau đáng kể hay không; hoặc liệu các mô hình của Trung Quốc sẽ luôn được hiểu là giống với các mô hình biên giới của Mỹ cách đây 3 đến 9 tháng hay không.

Kết luận: Cân bằng toàn cầu

Trước chuyến đi này, tôi biết quá ít về Trung Quốc; và khi rời đi, tôi cảm thấy như mình vừa mới bắt đầu học hỏi. Trung Quốc không phải là nơi có thể thể hiện bằng các quy tắc hay công thức nấu ăn, mà là một nơi có động lực và sự ăn ý rất khác nhau. Văn hóa của nó rất cổ xưa, rất sâu sắc và vẫn hoàn toàn gắn bó với cách xây dựng công nghệ trong nước. Tôi vẫn còn rất nhiều điều để học hỏi.

Nhiều bộ phận trong cơ cấu quyền lực hiện tại của Hoa Kỳ sử dụng quan điểm hiện có của họ về Trung Quốc như một công cụ tâm lý quan trọng trong việc ra quyết định. Sau khi tiếp xúc trực tiếp chính thức hoặc không chính thức với hầu hết các phòng thí nghiệm AI hàng đầu ở Trung Quốc, tôi phát hiện ra rằng Trung Quốc có nhiều phẩm chất và bản năng khó có thể bắt chước theo phong cách ra quyết định của phương Tây.

Ngay cả khi tôi trực tiếp hỏi các phòng thí nghiệm này tại sao họ muốn công khai những mô hình mạnh nhất của mình, tôi vẫn khó có thể kết nối hoàn toàn sự giao thoa giữa "tâm lý sở hữu" và "sự ủng hộ chân thành của hệ sinh thái".

Các phòng thí nghiệm ở đây rất thực dụng và không nhất thiết phải theo chủ nghĩa tuyệt đối khi nói đến nguồn mở và không phải mọi mô hình mà họ xây dựng đều được mở để phát hành. Nhưng họ có ý định sâu sắc trong việc hỗ trợ các nhà phát triển, hỗ trợ hệ sinh thái và sử dụng tính mở như một cách để hiểu sâu hơn về mô hình của chính họ.

Hầu hết mọi công ty công nghệ lớn của Trung Quốc đều đang xây dựng mô hình ngôn ngữ chung của riêng mình. Chúng ta đã thấy rằng các công ty dịch vụ nền tảng như Meituan và các công ty công nghệ tiêu dùng lớn như Xiaomi đã tung ra các mẫu máy có trọng lượng mở. Các công ty tương tự ở Mỹ thường chỉ mua dịch vụ.

Các công ty này xây dựng các mô hình ngôn ngữ lớn không phải để đạt được cảm giác hiện diện trong những điều mới mẻ mà xuất phát từ mong muốn cơ bản và sâu sắc: kiểm soát kho công nghệ của riêng họ và phát triển công nghệ quan trọng nhất vào lúc này. Khi nhìn lên từ máy tính xách tay của mình, tôi luôn thấy những cụm cần cẩu ở phía chân trời, điều này rõ ràng phù hợp với văn hóa và năng lượng xây dựng rộng lớn hơn của Trung Quốc.

Sự tiếp xúc con người, sự quyến rũ và sự ấm áp chân thành của các nhà nghiên cứu Trung Quốc rất gần gũi với mọi người. Ở cấp độ cá nhân, không có cuộc thảo luận địa chính trị gay gắt nào mà chúng ta quen thuộc ở Hoa Kỳ thâm nhập được vào chúng. Thế giới có thể sử dụng nhiều hơn sự tích cực đơn giản này. Với tư cách là một thành viên của cộng đồng AI, giờ đây tôi lo ngại hơn rằng những rạn nứt đang xuất hiện giữa các thành viên và các nhóm xung quanh nhãn hiệu quốc tịch.

Sẽ là nói dối nếu nói rằng tôi không mong đợi các phòng thí nghiệm của Hoa Kỳ sẽ trở thành những người dẫn đầu rõ ràng trong mọi lĩnh vực công nghệ AI. Đặc biệt là trong không gian mô hình mở nơi tôi đầu tư nhiều thời gian, tôi là người Mỹ và đó là một sở thích trung thực.

Đồng thời, tôi hy vọng rằng bản thân hệ sinh thái mở có thể phát triển trên quy mô toàn cầu vì điều này có thể tạo ra AI an toàn hơn, dễ tiếp cận hơn và hữu ích hơn cho thế giới. Câu hỏi bây giờ là liệu các phòng thí nghiệm của Hoa Kỳ có hành động để đảm nhận vị trí dẫn đầu này hay không.

Khi tôi viết bài này, ngày càng có nhiều tin đồn về tác động của lệnh hành pháp đối với mô hình mở. Điều này có thể làm phức tạp thêm mối quan hệ hiệp đồng giữa sự lãnh đạo của Hoa Kỳ và hệ sinh thái toàn cầu - điều này không khiến tôi tự tin hơn chút nào.

Cảm ơn tất cả những người tuyệt vời mà tôi đã hân hạnh được trò chuyện tại Dark Side of the Moon, Zhipu, Meituan, Xiaomi, Tongyi Qianwen, Ant Emmanuel, 01.ai và những người khác. Mọi người đều rất niềm nở và hào phóng với thời gian của họ. Khi suy nghĩ của tôi hình thành, tôi sẽ tiếp tục chia sẻ những quan sát về Trung Quốc, cả ở cấp độ văn hóa rộng hơn và chính lĩnh vực AI.

Rõ ràng, kiến thức này sẽ liên quan trực tiếp đến câu chuyện đang diễn ra về những bước phát triển tiên phong trong lĩnh vực AI.

[Liên kết gốc]

Tại sao AI của Trung Quốc phát triển nhanh đến vậy? Câu trả lời nằm bên trong phòng thí nghiệm

Tâm lý của các nhà nghiên cứu Trung Quốc

Sự khác biệt và tương đồng giữa ngành công nghiệp AI của Trung Quốc và các phòng thí nghiệm phương Tây

Kết luận: Cân bằng toàn cầu

Artikel Berkaitan

一周热门项目动态：Base 引入 ZK 技术替代挑战期、Polygon 上线稳定币隐私转账、Kalshi 融资 10 亿等（0503–0509）

Crypto 交易员自述：朋友都在离开，这个行业还剩什么可做？

GensynAI : 不要让AI重蹈互联网的覆辙

中国AI为什么发展得这么快？答案藏在实验室内部

Produk

Undang-Undang & Sokongan

Pautan Rakan