Tác giả: Frank, PANews
Khi AI dần chuyển từ thể hiện kỹ thuật sang thực dụng, việc triển khai ứng dụng AI đang không ngừng tăng tốc để đáp ứng nhu cầu ngày càng tăng của người tiêu dùng. Đồng thời, với sự nâng cao không ngừng của năng lực các mô hình lớn, dường như AI đã bước vào thời đại "ai cũng có thể tạo ra nguyên mẫu sản phẩm".
Trong tuần lễ muShanghai AI Week, phiên tọa đàm với chủ đề "Thực tiễn sáng tạo và con đường khám phá hệ sinh thái AI tiêu dùng" do PANews chủ trì đã tập trung vào con đường triển khai thực tế của các sản phẩm AI tiêu dùng. Các khách mời tham gia thảo luận bao gồm Feng Wen, Trưởng phòng sản phẩm nền tảng mở MiniMax; Levy, CEO FateTell; Anita, Trưởng bộ phận APAC của Sentient; và nhạc sĩ điện tử, nhà phát triển độc lập Gao Jiafeng, đại diện cho các lĩnh vực khác nhau như nền tảng mở mô hình, ứng dụng văn hóa ra thị trường quốc tế, hệ sinh thái AI nguồn mở và thực hành sáng tác âm nhạc.
Theo quan điểm của các khách mời, vấn đề cốt lõi của AI tiêu dùng không hề trở nên đơn giản hơn nhờ sự lặp lại của công nghệ. Sau khi năng lực mô hình được nâng cao, rào cản thực sự đang chuyển sang việc hiểu bối cảnh, tổ chức dữ liệu, giáo dục người dùng, giá trị cảm xúc và xây dựng hệ sinh thái mở.
AI không hạ thấp độ khó khởi nghiệp, rào cản thực sự vẫn là bối cảnh ứng dụng
Một mâu thuẫn phổ biến trong ngành AI là: mô hình ngày càng mạnh mẽ, ngưỡng khởi nghiệp dường như giảm xuống, nhưng nhiều sản phẩm lại khó tìm được bối cảnh tồn tại lâu dài. Ứng dụng có vẻ khả thi hôm nay, có thể nhanh chóng mất đi lý do tồn tại sau khi phiên bản mô hình tiếp theo được phát hành.
Theo Feng Wen, đối với sản phẩm AI tiêu dùng, ý tưởng sản phẩm và phán đoán bối cảnh vẫn quan trọng hơn. MiniMax với tư cách là nhà cung cấp mô hình lớn và nền tảng mở, sẽ nhấn mạnh hơn vào năng lực mô hình cơ bản, thiết kế sản phẩm liên quan đến Token và trải nghiệm end-to-end cho nhà phát triển. Nhưng từ góc độ nhà khởi nghiệp, sản phẩm nên được thiết kế dựa trên "trình độ thông minh của mô hình sau sáu tháng".
Phán đoán của ông là, trong bối cảnh quy luật mở rộng mô hình vẫn chưa mất hiệu lực và năng lực mô hình tiếp tục được nâng cao, các nhà khởi nghiệp không nên bị hạn chế quá mức bởi tốc độ, chi phí hoặc ranh giới năng lực của mô hình hiện tại, mà nên suy nghĩ táo bạo hơn về đối tượng người dùng mục tiêu, bối cảnh cụ thể và vấn đề cần giải quyết. Các nhà cung cấp mô hình sẽ tiếp tục cung cấp các khả năng rẻ hơn, nhanh hơn và có tỷ lệ chi phí-hiệu quả cao hơn, trong khi tầng ứng dụng cần trả lời rõ ràng hơn câu hỏi "tại sao lại là bối cảnh này".
Levy từ tầng ứng dụng bổ sung thêm một nguồn rào cản khác. Ông cho rằng, công nghệ thay đổi rất nhanh, nhưng dữ liệu và sự hiểu biết tương ứng với bối cảnh không bị xóa nhòa nhanh chóng. Trước đây nhiều người cho rằng chỉ có thể tinh chỉnh mô hình mới có thể tạo ra rào cản dữ liệu; nhưng với sự trưởng thành của kỹ thuật ngữ cảnh và kỹ thuật gợi ý, dữ liệu và cấu trúc tích lũy trong quản lý ngữ cảnh của ứng dụng cũng sẽ thay đổi biểu hiện của mô hình. Đặc biệt là một số dữ liệu liên quan đến trải nghiệm cá nhân hóa cao hoặc văn hóa, không nhất thiết sẽ đi vào trọng số của mô hình tổng quát, điều này ngược lại có thể trở thành cơ sở khác biệt hóa cho sản phẩm AI tiêu dùng để chống lại sự lặp lại của mô hình.
Anita đưa ra quan điểm thận trọng hơn về "AI hạ thấp ngưỡng khởi nghiệp". Bà cho rằng, AI thực sự giúp việc tạo mẫu demo, xây dựng nguyên mẫu, nhanh chóng ra mắt một sản phẩm ban đầu trở nên dễ dàng hơn, nhưng phần khó khăn thực sự của khởi nghiệp không biến mất, thậm chí có thể nổi bật hơn: làm thế nào để thu hút khách hàng, xây dựng sự gắn kết cộng đồng, hoàn thành triển khai thương mại, và thiết lập kết nối giữa người với người ngoài lập trình. Bà đề cập, khái niệm cá nhân siêu hạng và "công ty một người" hiện đang được quan tâm, nhưng những cá nhân thực sự có thể vận hành thành công, thường cần khả năng tổng hợp hơn, không chỉ đơn thuần là gọi mô hình lớn.
Từ bát tự đến âm nhạc: "Hiểu người dùng hơn" trở thành rào cản của AI tiêu dùng
Khi năng lực công nghệ không ngừng dịch chuyển về phía trước, giá trị của sản phẩm AI tiêu dùng cuối cùng vẫn phải quay trở lại nhu cầu của con người.
Thực tiễn của FateTell cung cấp một trường hợp điển hình. Levy giới thiệu, FateTell là ứng dụng tiêu dùng AI + tử vi/phong thủy phương Đông (bát tự) hướng đến người dùng quốc tế, hiện có người dùng tại hơn 90 quốc gia. Ngay từ đầu, đội ngũ đã tránh hướng đi thuần túy là công cụ hiệu suất, mà chú trọng vào tiêu dùng tinh thần và giá trị cảm xúc.
Theo ông, việc tìm hiểu vận mệnh bản thân, tìm kiếm lời giải thích và sự an ủi, là nhu cầu tâm lý nền tảng lâu dài, xuyên văn hóa. Trước đây, AI rất khó thiết lập niềm tin trong bối cảnh này, nhưng sự cải thiện năng lực của các mô hình như DeepSeekR1, về mặt khách quan đã giúp người dùng và nhà đầu tư hiểu khả năng "mô hình lớn có thể thực hiện suy luận và giải thích phức tạp". Rào cản mà FateTell đối mặt không chỉ là năng lực mô hình, mà còn là làm thế nào để dịch thuật, chuyển ngữ các khái niệm văn hóa Trung Quốc như thiên can địa chi, Kinh Dịch, bát tự cho người dùng quốc tế, và thông qua ngôn ngữ, hình ảnh và tương tác để những người có nền văn hóa khác nhau hiểu được sức hấp dẫn của chúng.
Gao Jiafeng từ góc độ người sáng tác âm nhạc đã đưa ra vấn đề tương tự: AI không chỉ nên giao kết quả, mà cần giữ lại quá trình. Ông đề cập, các công cụ như Suno khiến việc tạo nhạc trở nên rất trực tiếp, nhưng cũng bỏ qua quá trình sáng tạo, dẫn đến người dùng thiếu cảm giác tham gia và thuộc về. Đối với nhạc sĩ và người dùng thông thường, sáng tạo không chỉ để có một "bài hát thành phẩm", bản thân quá trình đã là một phần của trải nghiệm.
Ông dùng bóng đá để ví von: ngay cả khi người bình thường không bao giờ vượt qua được Messi hay Ronaldo, họ vẫn chơi bóng vì đam mê. Sáng tác âm nhạc cũng như vậy. Gao Jiafeng đang phát triển MusicAIGameBoy (máy chơi game âm nhạc AI), cố gắng thông qua mô hình lớn hoặc mô hình nhỏ AI để điều khiển mã âm nhạc, kết hợp với tương tác hóa game, cho phép những người không biết âm nhạc cũng có thể tham gia sáng tạo trong khi chơi. Đối với ông, bối cảnh thực sự không phải là "tự động tạo một bài hát", mà là trả lại quá trình tương tác sáng tác âm nhạc cho người dùng.
Sau khi Agent trỗi dậy, logic giáo dục người dùng đang thay đổi
Trong sản phẩm AI tiêu dùng, giáo dục người dùng thường quyết định việc sản phẩm có thực sự được sử dụng hay không.
Feng Wen đề cập, trong số người dùng mà nền tảng mở MiniMax tiếp xúc, có một số có nền tảng phát triển, nhưng vẫn bị cản trở bởi tài liệu API, tham số, mã lỗi và cách sử dụng Token. Vì vậy, nền tảng sẽ cung cấp các phương thức như nền tảng thử nghiệm mô hình, hướng dẫn phát triển, ví dụ minh họa, video hướng dẫn để nhà phát triển hoàn thành quá trình từ hiểu đến gọi nhanh hơn.
Với sự phát triển của Agent, cách thức giáo dục người dùng cũng đang thay đổi. Trước đây người dùng cần đọc tài liệu, hiểu giao diện, xử lý lỗi. Nhưng với sự nâng cấp hiệu suất của Agent, hiện nay nhiều người dùng đã để Agent trực tiếp đọc tài liệu, tìm kiếm giải pháp, chọn mô hình phù hợp và tự động sửa đường dẫn. Các nhà cung cấp mô hình cần làm tốt trải nghiệm mô hình, tài liệu và nền tảng, trong khi cộng đồng, nhà phát triển và các hình thái sản phẩm khác nhau sẽ cùng nhau hạ thấp ngưỡng sử dụng.
Đối với Sentient, bản thân hệ sinh thái mở cũng là một phần của giáo dục người dùng và triển khai sản phẩm. Anita giới thiệu, Sentient tập trung vào hệ sinh thái AI nguồn mở và cơ sở hạ tầng liên quan, đồng thời tập hợp nhà phát triển thông qua các hackathon, kế hoạch tài trợ. Bà nhấn mạnh, sản phẩm trước hết phải nhìn rõ người dùng mục tiêu của mình: người dùng là ai, xuất hiện ở đâu, thông qua kênh nào để thiết lập niềm tin. Đối với công cụ dành cho nhà phát triển, hackathon và hợp tác hệ sinh thái là lối vào hiệu quả; còn đối với sản phẩm tiêu dùng, KOL, KOC và nội dung mạng xã hội cũng rất quan trọng.
Trong bối cảnh chi phí AIGC giảm nhanh, các đội khởi nghiệp có thể sản xuất trailer, tài liệu hình ảnh và nội dung truyền thông với chi phí thấp hơn, giúp sản phẩm nhanh chóng có được nhóm người dùng đầu tiên. Gao Jiafeng cũng cho rằng, thiết kế sản phẩm nên cố gắng tiếp cận người dùng, để người dùng học một cách tự nhiên thông qua tương tác và giải trí, thay vì phụ thuộc vào nhiều hướng dẫn sử dụng. Cách thức "học trong khi sử dụng" này có thể phù hợp với AI tiêu dùng hơn so với các hướng dẫn truyền thống.
Phần cứng bước vào thế giới thực, cá nhân hóa và giá trị cảm xúc tiếp tục được phóng đại
Sau ba đến năm năm tới, các khách mời nhìn chung cho rằng, thị trường AI tiêu dùng vẫn đang ở giai đoạn thâm nhập sớm, nhưng hình thái sản phẩm sẽ có sự thay đổi rõ rệt.
Feng Wen phán đoán, trong ba đến năm năm tới, phần cứng thông minh, robot và trí tuệ thể hiện sẽ đón nhận điểm ngoặt quan trọng. Sau khi năng lực mô hình được nâng cao, AI không chỉ tồn tại trong giao diện phần mềm, mà còn bước vào thế giới vật lý thực, hoàn thành nhiều tương tác và nhiệm vụ hơn. Một số sản phẩm sẽ hướng đến con người, cung cấp nâng cao hiệu suất hoặc giá trị cảm xúc. Một số sản phẩm khác có thể hướng đến Agent, cung cấp môi trường, công cụ và cơ sở hạ tầng kết nối thế giới vật lý cho AI. Nhưng dù hình thái thay đổi thế nào, sản phẩm cuối cùng vẫn nên lấy con người làm trung tâm, để con người dành nhiều thời gian hơn cho kết nối giữa người với người, gia đình, thế giới thực và trải nghiệm cuộc sống phong phú hơn.
Levy cho rằng, dự đoán ba đến năm năm trong ngành AI đã rất khó khăn, thậm chí ba đến năm tháng cũng đầy bất ổn. Ông cho rằng, mặc dù người dùng tiên phong đã sử dụng sâu các công cụ như ClaudeCode, nhưng phần lớn người dùng phổ thông vẫn ở giai đoạn thâm nhập AI khá sớm. Vài năm tới, AI sẽ tiếp tục đáp ứng các nhu cầu chi tiết hơn, cá nhân hóa hơn. So với dịch vụ tương đối "nghìn người như một" thời kỳ internet di động, AI có cơ hội cung cấp dịch vụ cụ thể hơn, phân khúc hơn cho mỗi người. Đồng thời, lo lắng mất việc và cảm giác bất an do phát triển công nghệ mang lại, cũng có thể tiếp tục khuếch đại nhu cầu tiêu dùng tinh thần như tâm lý đồng hành.
Anita tổng kết sự thay đổi này là "bình đẳng hóa công nghệ". Bà cho rằng, trong tương lai sự phân biệt giữa các phân loại như văn học, khoa học tự nhiên, nghệ thuật, công nghệ sẽ bị suy yếu. Một tiểu thương cũng có thể thông qua AI để tạo quảng cáo, đẩy thông tin định hướng, từ đó cải thiện việc kinh doanh của mình. Giá trị của AI không nhất thiết là biến mọi người thành lập trình viên hàng đầu, mà là giúp người trong các bối cảnh cuộc sống khác nhau có được công cụ tốt hơn. Đồng thời, nỗi sợ thất nghiệp và cảm giác cô đơn sẽ thúc đẩy nhu cầu giá trị cảm xúc tăng lên, phần cứng, thú cưng AI, thiết bị đồng hành và sản phẩm tương tác đa giác quan sẽ có nhiều cơ hội hơn.
Gao Jiafeng xuất phát từ sự thay đổi hình thái văn hóa. Ông cho rằng, trong tương lai các hình thức nội dung như âm nhạc, phim ảnh, video sẽ được tổ chức lại, thậm chí "bài hát" có phải là đơn vị tiêu dùng âm nhạc nhỏ nhất hay không cũng không chắc chắn. Các khái niệm hiện tại như âm thanh đa luồng, âm đạo, trong tương lai có thể tiếp tục bị chia nhỏ thành các đơn vị sáng tạo nguyên tử hơn. Nhưng trong khi hình thức bị giải thể, IP, thương hiệu và nhân vật cụ thể mang kết nối cảm xúc sẽ trở nên quan trọng hơn. Điều con người theo đuổi không phải lúc nào cũng là tác phẩm hoàn hảo, mà là đối tượng có khiếm khuyết, có nhiệt độ, có thể thiết lập mối quan hệ cảm xúc.
Mặc dù các khách mời không đưa ra câu trả lời thống nhất cho AI tiêu dùng, nhưng các cuộc thảo luận từ các lĩnh vực khác nhau như nền tảng mô hình, ứng dụng văn hóa, hệ sinh thái nguồn mở và sáng tác âm nhạc, cùng chỉ ra một xu hướng chung: khi năng lực mô hình tiếp tục được nâng cao, cạnh tranh AI tiêu dùng không còn chỉ là "ai gọi mô hình mạnh hơn", mà là liệu có thể hiểu người dùng cụ thể hơn, bối cảnh thực tế và nhu cầu cảm xúc hay không.
Hệ sinh thái AI tiêu dùng trong tương lai, có thể đồng thời bao gồm cơ sở hạ tầng mở mạnh mẽ hơn, ngưỡng phát triển thấp hơn, dịch vụ cá nhân hóa hơn, phần cứng có cảm giác đồng hành hơn, cũng như nhiều hình thái sản phẩm mới xoay quanh văn hóa và quá trình sáng tạo hơn. Mô hình sẽ tiếp tục tiến hóa, nhưng thứ thực sự có thể tồn tại, vẫn là những sản phẩm có thể được con người cần, được con người hiểu, và thiết lập kết nối với con người.







