6 min read

DeepSeek: Mọi Điều Cần Biết Về Ứng Dụng Chatbot AI Đình Đám

DeepSeek, ứng dụng chatbot AI từ Trung Quốc, đang gây bão khi vươn lên dẫn đầu bảng xếp hạng App Store và Google Play. Với các mô hình AI hiệu quả, DeepSeek khiến cả Phố Wall và giới công nghệ đặt câu hỏi về vị thế của Mỹ trong cuộc đua AI.

DeepSeek: Mọi Điều Cần Biết Về Ứng Dụng Chatbot AI Đình Đám

DeepSeek đang trở thành hiện tượng toàn cầu.

Phòng thí nghiệm AI của Trung Quốc, DeepSeek, đã bùng nổ trên thị trường khi ứng dụng chatbot của họ nhanh chóng vươn lên dẫn đầu bảng xếp hạng App Store của Apple và Google Play. Những mô hình AI của DeepSeek, được huấn luyện bằng các kỹ thuật tối ưu hóa tài nguyên tính toán, đã khiến các nhà phân tích Phố Wall và giới công nghệ đặt câu hỏi liệu Mỹ có thể duy trì vị thế dẫn đầu trong cuộc đua AI và nhu cầu về chip AI có còn tiếp tục hay không.

Nhưng DeepSeek đến từ đâu, và làm thế nào mà họ lại nổi tiếng quốc tế nhanh đến vậy?

Nguồn gốc của DeepSeek từ giới giao dịch tài chính

DeepSeek được hậu thuẫn bởi High-Flyer Capital Management, một quỹ đầu cơ định lượng của Trung Quốc sử dụng AI để đưa ra các quyết định giao dịch.

Nhà đam mê AI Liang Wenfeng là đồng sáng lập của High-Flyer vào năm 2015. Wenfeng, người bắt đầu quan tâm đến giao dịch khi còn là sinh viên tại Đại học Chiết Giang, đã ra mắt High-Flyer Capital Management vào năm 2019 với trọng tâm là phát triển và triển khai các thuật toán AI cho tài chính.

Năm 2023, High-Flyer thành lập DeepSeek như một phòng thí nghiệm nghiên cứu các công cụ AI độc lập với mảng kinh doanh tài chính. Nhờ sự đầu tư từ High-Flyer, phòng thí nghiệm này sau đó tách ra thành một công ty riêng, cũng mang tên DeepSeek.

Ngay từ đầu, DeepSeek đã xây dựng cụm trung tâm dữ liệu của riêng mình để huấn luyện mô hình. Tuy nhiên, giống như nhiều công ty AI khác ở Trung Quốc, DeepSeek cũng bị ảnh hưởng bởi lệnh cấm xuất khẩu phần cứng của Mỹ. Để huấn luyện một trong những mô hình gần đây, công ty buộc phải sử dụng chip Nvidia H800, một phiên bản yếu hơn so với chip H100, vốn chỉ có sẵn cho các công ty Mỹ.

Đội ngũ kỹ thuật của DeepSeek được cho là có độ tuổi khá trẻ. Công ty mạnh tay tuyển dụng các nghiên cứu sinh tiến sĩ AI từ các trường đại học hàng đầu Trung Quốc. Theo The New York Times, DeepSeek thậm chí còn tuyển dụng những người không có nền tảng khoa học máy tính để giúp AI của họ hiểu được nhiều chủ đề khác nhau.

Những mô hình mạnh mẽ của DeepSeek

DeepSeek ra mắt bộ mô hình AI đầu tiên vào tháng 11/2023, bao gồm DeepSeek Coder, DeepSeek LLM và DeepSeek Chat. Tuy nhiên, mãi đến mùa xuân năm ngoái, khi startup này tung ra dòng DeepSeek-V2, ngành công nghiệp AI mới thực sự chú ý.

DeepSeek-V2, một hệ thống phân tích văn bản và hình ảnh đa năng, đã đạt thành tích xuất sắc trên nhiều bảng xếp hạng AI—và vận hành rẻ hơn đáng kể so với các mô hình cùng thời điểm. Điều này buộc các đối thủ trong nước như ByteDance và Alibaba phải giảm giá sử dụng một số mô hình của họ, thậm chí cung cấp miễn phí.

Vào tháng 12/2024, DeepSeek tiếp tục gây chấn động với DeepSeek-V3.

Theo kết quả thử nghiệm nội bộ, DeepSeek V3 vượt trội hơn cả các mô hình mã nguồn mở như Llama của Meta, cũng như các mô hình độc quyền chỉ có thể truy cập qua API như GPT-4o của OpenAI.

Cũng đáng chú ý là mô hình DeepSeek R1, được công bố vào tháng 1/2025. DeepSeek tuyên bố R1 có hiệu suất ngang bằng với mô hình o1 của OpenAI trên các bài kiểm tra quan trọng.

Vì là một mô hình reasoning (lập luận), R1 có thể tự kiểm tra lại thông tin, giúp giảm thiểu các lỗi thường gặp. Tuy mất nhiều thời gian hơn để đưa ra kết quả (từ vài giây đến vài phút), nhưng đổi lại, mô hình này lại đáng tin cậy hơn trong các lĩnh vực như vật lý, khoa học và toán học.

Tuy nhiên, có một hạn chế đối với R1, DeepSeek V3 và các mô hình AI khác của DeepSeek. Vì được phát triển tại Trung Quốc, các mô hình này phải tuân thủ quy định kiểm duyệt nội dung của chính phủ. Ví dụ, chatbot của DeepSeek không thể trả lời các câu hỏi về sự kiện Thiên An Môn hay quyền tự trị của Đài Loan.

Chiến lược kinh doanh gây tranh cãi

DeepSeek đang áp dụng một mô hình kinh doanh khá bí ẩn. Công ty định giá sản phẩm và dịch vụ thấp hơn nhiều so với thị trường—thậm chí một số còn miễn phí. Họ cũng không nhận đầu tư từ các quỹ mạo hiểm, dù đang nhận được rất nhiều sự quan tâm.

DeepSeek cho rằng các đột phá về tối ưu hóa đã giúp họ duy trì chi phí cực thấp. Tuy nhiên, một số chuyên gia hoài nghi về con số mà công ty công bố.

Dù sao đi nữa, các nhà phát triển đang đổ xô sử dụng các mô hình của DeepSeek. Dù không hoàn toàn mã nguồn mở, nhưng chúng có giấy phép khá dễ chịu, cho phép sử dụng thương mại. Theo Clem Delangue, CEO của Hugging Face, đã có hơn 500 mô hình dẫn xuất từ R1 được phát triển trên nền tảng này, với tổng lượt tải xuống lên đến 2,5 triệu lần.

Thành công của DeepSeek đã làm chấn động ngành công nghệ AI. Một số chuyên gia cho rằng DeepSeek đang “phá vỡ thế độc quyền AI,” trong khi một số khác gọi đó là “quá phóng đại.”

Sự trỗi dậy của DeepSeek thậm chí còn khiến cổ phiếu Nvidia giảm 18% vào tháng 1/2025 và thu hút sự chú ý từ CEO OpenAI Sam Altman. Vào tháng 3, Bộ Thương mại Mỹ đã yêu cầu nhân viên không sử dụng DeepSeek trên các thiết bị chính phủ, theo Reuters.

Microsoft đã thông báo tích hợp DeepSeek vào dịch vụ Azure AI Foundry, nền tảng AI dành cho doanh nghiệp của họ. Trong cuộc họp tài chính quý 1, CEO Meta Mark Zuckerberg khẳng định rằng đầu tư vào hạ tầng AI vẫn là “lợi thế chiến lược” của Meta, bất chấp sự xuất hiện của DeepSeek.

OpenAI thì có thái độ đối đầu, cáo buộc DeepSeek được nhà nước Trung Quốc trợ cấp và kiểm soát, đồng thời khuyến nghị chính phủ Mỹ cấm các mô hình AI của DeepSeek.

Trong cuộc họp tài chính quý 4, CEO Nvidia Jensen Huang lại khen ngợi DeepSeek là một “đột phá xuất sắc,” đồng thời nhấn mạnh rằng các mô hình reasoning như của DeepSeek sẽ càng thúc đẩy nhu cầu về phần cứng AI.

Tương lai của DeepSeek?

Dù thành công, DeepSeek vẫn đang đối mặt với nhiều thách thức. Một số quốc gia và công ty đã bắt đầu cấm DeepSeek, bao gồm Hàn Quốc và chính quyền bang New York của Mỹ.

Chính phủ Mỹ cũng ngày càng lo ngại về ảnh hưởng từ DeepSeek. Vào tháng 3/2025, The Wall Street Journal tiết lộ rằng Mỹ có thể sẽ chính thức cấm DeepSeek trên các thiết bị chính phủ.

DeepSeek chắc chắn sẽ tiếp tục phát triển các mô hình AI tiên tiến hơn. Nhưng trong bối cảnh căng thẳng địa chính trị leo thang, tương lai của DeepSeek trên thị trường toàn cầu vẫn là một dấu hỏi lớn.

(Bài viết ban đầu được xuất bản vào ngày 28/1/2025 và sẽ được cập nhật thường xuyên.)

#Công nghệ

#Kiến thức dịch vụ