Nhóm sinh viên với startup AI “3 in 1”

Trung Kiên
Khi chứng kiến sự bùng nổ của trí tuệ nhân tạo, một nhóm sinh viên đã bắt tay thực hiện sản phẩm có thể vừa sáng tạo nội dung như ChatGPT, tìm kiếm thông tin như Google, lại có thể thiết kế slide như PowerPoint. Từ đó, NaviAI - trợ lý ảo AI hỗ trợ sáng tạo nội dung và biểu diễn, thuyết trình ra đời.

Tự động hoá hàng loạt khâu “hậu cần” thuyết trình

Dự án trợ lí ảo AI hỗ trợ sáng tạo nội dung và biểu diễn, thuyết trình (NaviAI) đã xuất sắc lọt vào top 10 vòng chung kết cuộc thi tìm kiếm ý tưởng, dự án khởi nghiệp sáng tạo cấp trung ương năm 2023 vừa diễn ra. Sản phẩm do nhóm sinh viên Nguyễn Lâm Phương, Nguyễn Tuấn Hiệp, Lê Vũ Quang Huy… đến từ Viện Kỹ thuật và Khoa học máy tính và Viện Kinh doanh Quản trị (VinUni) phát triển.

Nói về lý do NaviAI ra đời, các bạn chia sẻ, đã từng phải thức trắng 24 giờ đồng hồ để chuẩn bị script và slide cho một phần thuyết trình trên lớp. Họ ước rằng giá như có một “cỗ máy” giúp họ hoàn tất các slide, thay vì phải thao tác thủ công. Nhưng tất nhiên điều đó không, đúng hơn là chưa xảy ra.

start-up-na-vi-ai-1706860711.jpg
NaviAI đã xuất sắc lọt vào top 10 vòng chung kết cuộc thi tìm kiếm ý tưởng

Cũng từ đó, họ nhận ra việc mất quá nhiều thời gian (trung bình khoảng 20 giờ) để chuẩn bị nội dung, làm slide hay là báo cáo sau mỗi buổi thuyết trình dường như là “nỗi đau” với rất nhiều người, không chỉ riêng sinh viên.

Cũng khoảng thời gian đó, Nguyễn Tuấn Hiệp có ý tưởng bắt tay “mày mò” viết những dòng code đầu tiên để tạo ra một ứng dụng giúp “tự động hoá” việc chuẩn bị các bài thuyết trình.

Tuy nhiên, dự án chỉ được khởi động chính thức khi Nguyễn Lâm Phương nhìn thấy và nói: “Ý tưởng này thực sự hữu ích. Chúng ta phải mang nó đi… khởi nghiệp”. Nói là làm, họ rủ thêm một số bạn bè và hình thành nhanh chóng một đội ngũ để “vào việc”.

“Khi nhìn thấy sự bùng nổ của ChatGPT và những công cụ tự động hóa ứng dụng trí tuệ nhân tạo, chúng em đã nghĩ đến một sản phẩm có thể vừa sáng tạo nội dung như ChatGPT, tìm kiếm thông tin như Google, lại có thể thiết kế slide như PowerPoint. Và từ đó chúng em mang đến NaviAI - trợ lý ảo AI hỗ trợ tiết kiệm thời gian, công sức cho việc sáng tạo nội dung và biểu diễn, thuyết trình”, Phương chia sẻ.

NaviAI có 4 tính năng chính. Đầu tiên là VizMate: Người dùng sẽ nhập vào các ý tưởng, số liệu thô và nhận được đầu ra là các hình ảnh hay biểu đồ minh họa; tiếp theo, sử dụng tính năng PrepMate: Người dùng sẽ nhập dàn ý và các hình ảnh, biểu đồ cần dùng trong bài thuyết trình.

anh-man-hinh-2024-01-06-luc-000645-1706865426.png
 

Sau đó PrezMate sẽ giúp người dùng tự động chuyển slide dựa trên công nghệ nhận diện giọng nói và hiện phụ đề phiên dịch trong bài thuyết trình trực tiếp. Và cuối cùng, Summate sẽ tự động tạo video và văn bản tóm tắt sau buổi thuyết trình.

Nói nôm na, ứng dụng này như một chatbot. Người dùng thay vì phải tạo một slide, kéo, thả các hình ảnh hoặc tự lên nội dung thì bây giờ, chỉ cần nhập một câu lệnh thì AI sẽ tự động cho ra kết quả nội dung cũng như các biểu đồ, slide. Khi cần sửa một slide nào đó thì việc thao tác cũng rất nhanh chóng chỉ với việc nhập các câu lệnh.

Lập doanh nghiệp, hợp tác với “ông lớn” Vingroup

Dự án khởi động từ tháng 3/2023 và “khởi nghiệp cùng Kawai” là cuộc thi đầu tiên mà NaviAI tham dự. Vượt qua hàng trăm đề án, NaviAI đã xuất sắc đạt quán quân với tổng giá trị giải thưởng 457 triệu đồng. Tháng 11/2023, nhóm lại tiếp tục giành vị trí quán quân tại Entre Global Incubator 2023…

Với định hướng là startup mang công nghệ vào ứng dụng trong đời sống, NaviAI đã nhận được cố vấn và hỗ trợ tài chính từ VinUni để không chỉ triển khai ý tưởng khởi nghiệp mà còn đưa công nghệ lõi của đội ngũ vào nghiên cứu khoa học thông qua hai chương trình là EntrePrep và Opportunities for Undergraduate Research.

Hiệp chia sẻ, với mỗi startup thì việc đưa sản phẩm ra thị trường như thế nào là vô cùng quan trọng. Khi bắt đầu nghiên cứu thị trường, nhóm nhận thấy AI toàn cầu, đặc biệt là Generative AI trong xử lý ngôn ngữ tự nhiên là một thị trường vô cùng tiềm năng.

Tại thị trường Việt Nam, có 2 nhóm đối tượng tiềm năng. Đầu tiên là nhóm khách hàng cá nhân, là bất cứ ai có nhu cầu sử dụng sản phẩm để sáng tạo nội dung và biểu diễn, thuyết trình. Thứ hai là nhóm khách hàng doanh nghiệp, tổ chức, đặc biệt là các đơn vị giáo dục đại học, khoa học hay truyền thông biểu diễn.

“Chúng em dự định đánh vào phân khúc là một sản phẩm cung cấp nhiều tính năng cho người dùng với một mức giá phải chăng”, Hiệp nói.

Với hướng đi đó, nhóm đã thành lập doanh nghiệp. Việc lập doanh nghiệp cũng không đơn thuần là để “cho oách”. Nhóm nhấn mạnh mục tiêu là thể hiện sự chuyên nghiệp, nghiêm túc và trách nhiệm với chính mình cũng như các nhà đầu tư.

Ở doanh nghiệp này, sự phân vai rất rõ ràng về vai trò, nhiệm vụ, tỷ lệ cổ phần, quyền quyết định… của từng thành viên. Ví dụ, Nguyễn Lâm Phương là CEO, Nguyễn Tuấn Hiệp là CTO, chuyên về công nghệ và phụ trách chính về sản phẩm, Lê Vũ Quang Huy là CMO. Ngoài ra còn có Nguyễn Ngọc Hà, Cao Gia Bảo, Nguyễn Thục Ngân, Nguyễn Tuấn Kiệt… với các vai trò khác nhau.

Và chỉ sau 6 tháng hình thành từ bước ý tưởng đến sản phẩm, thì NaviAI đã được hợp tác với các tổ chức, các doanh nghiệp lớn như VinUni, TEDx. Sản phẩm của nhóm cũng được chính thức góp mặt trong hệ thống giảng dạy của VinUni.

anh-man-hinh-2024-01-06-luc-000736-1706865530.png
Sản phẩm của nhóm cũng được chính thức góp mặt trong hệ thống giảng dạy của VinUni

Hiệp cho biết ưu điểm của NaviAI là công nghệ lõi Simultaneous Generative Transformer (SGT) của nhóm có thể đưa ra kết quả phù hợp nhất dựa trên khả năng context awareness, tức nhận diện ngữ cảnh.

Ví dụ, các phụ đề của Google nhiều lúc sai tên riêng, tên sản phẩm/thương hiệu. Đơn cử, nói VinFast Lux A2.0 chẳng hạn, phụ đề của Google bị nhầm thành “being fast relax a2.0”, nhưng sản phẩm của NaviAI khắc phục được hạn chế này và phụ đề vẫn rõ là “VinFast Lux A2.0”.

Ngoài ra, công nghệ này cũng hỗ trợ 127 ngôn ngữ khác nhau. Nếu người dùng muốn tạo một bài thuyết trình với nhiều ngôn ngữ khác nhau thì thường phải đưa lên Google dịch, rồi thao tác thủ công. Nhưng với NaviAI thì chỉ cần một câu lệnh. Với lợi thế cạnh tranh lớn về mặt ngôn ngữ, công nghệ này đã được quỹ của Vin đầu tư và nhóm cũng đang tiến hành viết báo cáo khoa học.

“Việc phát triển công nghệ độc quyền SGT với khả năng nhận diện ngữ cảnh và đa dạng hoá ngôn ngữ là lợi thế giúp chúng em có thể vươn ra toàn cầu, nếu cơ hội đến”, Hiệp nói.

Sẵn sàng thử thách và dấn thân

Nhưng khởi nghiệp không phải là cuộc chơi. Dù các thành viên là những người bạn với nhau từ trước, có sự phối hợp rất tốt trong quá trình làm việc, nhưng nhóm cũng đối mặt với không ít khó khăn.

Phương chia sẻ, chương trình học của cô 3 năm đầu ở Hà Nội, còn 2 năm thì học tại Mỹ. Với khoảng cách xa, lệch múi giờ, lại vừa bận học hành, thi cử… thì nhiều lúc các thành viên có những quan điểm trái chiều, tranh cãi khá lớn với các vấn đề.

“Tuy nhiên, dù nhiều áp lực nhưng chúng em đã ngồi lại và nhắc nhở nhau “chúng ta đã cố gắng, quyết tâm vì điều gì”, Phương nói.

Còn Hiệp thì cho biết: “Chúng em có ý tưởng, có đam mê nhưng thiếu kinh nghiệm lẫn nguồn lực. Nguồn vốn của chúng em vận hành đến nay chủ yếu là tiền thắng được từ các cuộc thi công nghệ và tiền tài trợ từ các quỹ đầu tư nghiên cứu khoa học của trường. Chưa kể, em và các bạn vừa bận học, vừa nghiên cứu thêm, lại startup nên cũng có khá nhiều áp lực”.

z5010574898843-40da2f5bfef3566381f502840c317a12-1706865595.jpg
 

“Làn sóng công nghệ vận động rất nhanh và khó lường. Sản phẩm phải liên tục được cập nhật. Những công nghệ mới, xu hướng mới ra đời thì nhóm đều phải học để thích nghi, và điều này đòi hỏi không ít thời gian và nguồn lực”, Hiệp nói.

Dù vậy, các bạn trẻ cho biết họ may mắn khi có được sự trợ giúp, cố vấn vô cùn quý giá từ Co-founder Go Stream Liêm Phạm hay giáo sư Wray Buntine - Giám đốc chương trình Khoa học Máy tính tại VinUni.

“Ngoài ra, một dự án của sinh viên, nếu chỉ mang ý tưởng đi “nói chuyện” với các nhà đầu tư thì rất khó. Nhưng nếu họ thấy mình có sản phẩm, có khách hàng và đã có những thành tựu ban đầu thì việc hợp tác cũng dễ dàng hơn”, Lâm Phương bày tỏ.

Về kế hoạch phát triển sản phẩm của NaviAI, nhóm chia làm 4 giai đoạn và dự tính đến tháng 6/2024 sẽ sẵn sàng ra mắt bộ giải pháp hoàn thiện.

Nhóm cho biết khi ra thị trường trong một năm đầu tiên, sẽ đi theo 2 kênh chính là B2B2C và B2B, tập trung vào cả 2 đối tượng khách hàng là cá nhân và doanh nghiệp. Với khách hàng cá nhân, nhóm sẽ đi theo hình thức subscription model - người dùng trả phí theo tháng. Còn với khách hàng doanh nghiệp, chi phí và các tính năng của sản phẩm sẽ được điều chỉnh dựa trên nhu cầu của khách hàng.

Chia sẻ về tầm nhìn tương lai, nhóm cho biết sẽ phát triển thêm trợ lý ảo ứng dụng AI sáng tạo nội dung số; hỗ trợ ghi nhớ và lên biên bản cuộc họp; thực hiện câu lệnh và các thiết bị thông minh; thực hiện câu lệnh trong nhà ở thông minh, phương tiện giao thông…

“Càng là những người trẻ, chúng em càng sẵn sàng thử thách và dấn thân vào những lĩnh vực mới, thậm chí tiên phong tại thị trường Việt Nam. Chúng em tin rằng người Việt Nam chúng ta không thua kém so với các bạn bè quốc tế nếu được tạo cơ hội và dám bước ra khỏi vùng an toàn”, Hiệp nói.