Kỹ sư trưởng Deepmind chia sẻ về cách vibe code, cách dùng AI trong code, lời khuyên cho anh em dev
Bailey cho biết rằng: “Đối với các junior: Đây là thời điểm tốt nhất để học cách trở thành một developer. Đối với các senior: Thế giới đang thay đổi, đây cũng là một trong những thời điểm thú vị nhất. Thế giới sẽ được làm phong phú bởi AI và đó là điều tất cả chúng ta cần nhận ra về lâu dài.”
Tác động của những thay đổi do AI tạo ra đối với nhà phát triển truyền thống so với nhà phát triển mới?
Theo Bailey, các nhà phát triển truyền thống cần học các bộ kỹ năng mới. Lực lượng lao động ở mảng phần mềm đang được gia tăng đáng kể. Sundar Pichai đã đề cập trong một cuộc họp báo cáo thu nhập của Google gần đây rằng hơn 30% code được tạo ra tại Google mỗi tuần là do AI tạo ra.
Mọi nhà phát triển đều đang học những điều mới và tất cả đang cùng nhau phát triển cũng như chứng kiến cách thế giới kỹ thuật phần mềm thay đổi. Điều đó chắc chắn đòi hỏi chúng ta thích ứng, học tập để có thể nhanh chóng làm quen với điều kiện mới hiện nay.
Có giới hạn nào khi sử dụng API từ AI Studio không và có kế hoạch mở rộng giới hạn này không?
Hiện tại, Gemini đang là một trong các bên khá rộng tay trong việc cho xài API. Gần như các model mới nhất đều có thể được xài API không giới hạn nhiều, đầy đủ context length,… chỉ là giới hạn số request mỗi phút.
Chia sẻ cụ thể về các chính sách dùng API miễn phí để nghiên cứu, Bailey cho biết: “Hiện Google đã có gói miễn phí cho Gemini APIs. Nếu cần tăng giới hạn tốc độ (rate limit), có một biểu mẫu trong tài liệu để gửi yêu cầu. Google cũng có chương trình Google AI Startups dành cho các startup, cung cấp tới 350.000 USD tín dụng Cloud (áp dụng cho Gemini APIs) trong hai năm. Đây là cách các nhóm phát trienr vừa tăng giới hạn tốc độ và lẫn quota cho các API Gemini call nhiều hơn.
Google giúp nhà phát triển chuyển đổi mượt mà từ prototype AI sang ứng dụng có khả năng mở rộng (scalable application) bằng các công cụ mới như thế nào?
Trước thắc mắc này, Bailey nói với mình rằng: “với việc ngày càng nhiều người tạo ra phần mềm, sẽ cần nhiều phương pháp hay nhất về AI (AI best practices) quanh việc bảo trì phần mềm theo thời gian và đảm bảo an toàn bảo mật. Các công cụ như Jules rất hữu ích vì chúng có thể lo các công việc “vệ sinh” phần mềm (software hygiene practices) như nâng cấp hoặc chuyển từ thư viện này sang thư viện khác. Điều này giúp nhà phát triển dành nhiều thời gian hơn cho việc xây dựng và ít lo lắng hơn về các vấn đề đó.Google cũng đang đầu tư đáng kể vào AI cho bảo mật phần mềm như một phần của Google Cloud Platform và điều này chắc chắn sẽ được mở rộng về lâu dài.”
Trong tương lai, khi việc trở thành developer dễ dàng hơn và có nhiều sản phẩm AI hơn ra đời, đâu là điểm khác biệt chính mà một nhà phát triển cần tạo ra cho sản phẩm của mình để nổi bật trên thị trường?
Từ quan sát trong ngành, Paige Bailey cảm thấy rằng một số công ty, ứng dụng, thiết kế thử nghiệm tốt nhất mà cô ấy thấy gần đây là từ những người thực sự tập trung vào trải nghiệm người dùng (user experience). Họ xây dựng cho một thị trường ngách (niche) và được định nghĩa rõ ràng.
Bailey trích lại một câu nói ở Google rằng “Tập trung vào người dùng và mọi thứ khác sẽ theo sau”. Điều tốt nhất mà nhà phát triển có thể làm là thực sự hiểu người dùng muốn gì và chuyển điều đó thành ứng dụng họ đang xây dựng.
Mặc dù hiện tại việc tạo ra ứng dụng đã dễ dàng hơn rất nhiều, nhưng nó vẫn đòi hỏi các kỹ sư phải có hiểu biết sâu sắc về sản phẩm. Đó chính là chìa khóa để có thể tăng tính cạnh tranh trên thị trường khốc liệt hiện nay.
Tầm nhìn của Google về sự phát triển của AI đa phương thức (multimodal AI) là gì và các ứng dụng tiềm năng với các công cụ của Google?
Paige Bailey không nói thay cho DeepMind, nhưng chị có nhắc đến V3 và các mô hình hội thoại thời gian thực có thể dịch cuộc trò chuyện trực tiếp giữa hai ngôn ngữ. Đó chính là minh chứng rõ nhất của ứng dụng của model AI đa phương thức.
Chị cho biết rằng DeepMind đang đầu tư mạnh mẽ vào trải nghiệm đa phương thức. Điều này bao gồm cả âm thanh-thành-âm thanh và các mô hình tạo video mạnh mẽ có thể hiểu vật lý, tạo nhạc nền, hiệu ứng âm thanh, hội thoại.
Điều này sẽ biến đổi những gì nhà phát triển đang xây dựng, cho phép tạo ra các ứng dụng thực tế tăng cường (AR) hoặc trải nghiệm nhập vai hoàn toàn (fully immersive experiences). Các ứng dụng sẽ có thể kết hợp nhiều loại thông tin khác nhau như video và âm thanh.
Đây là thời điểm thú vị không chỉ để trở thành một developer mà còn là người trực tiếp trải nghiệm cách AI biến đổi mọi sản phẩm. Google đang xây dựng những thứ từ khoa học viễn tưởng trở thành thực tế ngoài đời. Bailey đưa ra thí dụ về Babelfish trong Hitchhiker’s Guide to the Galaxy, hiện đã trở thành hiện thực.
Google có kế hoạch làm cho các công cụ AI trở nên cá nhân hóa hơn (personalized) cho từng nhà phát triển không?
Google thực sự tập trung vào việc kết hợp nhiều tính cá nhân hóa hơn vào các mô hình Gemini. Josh Woodward đã nhấn mạnh điều này trong bài phát biểu tại sự kiện Google IO ngày đầu tiên. Với cửa sổ ngữ cảnh dài hơn, có thể bao gồm tất cả các tùy chọn cá nhân và các khía cạnh công việc độc đáo của người dùng (làm việc với Docs, Sheets, Drive). Những thông tin chi tiết này có thể hướng dẫn các mô hình Gemini trở nên ngày càng cá nhân hóa theo nhu cầu của người dùng qua thời gian.
Bailey cho biết Google thực sự hy vọng xây dựng các trải nghiệm cá nhân hóa hơn với các mô hình Gemini và nhúng chúng vào trong các ứng dụng Google Workspace. Hiện có các cách tiếp cận khác nhau được đưa ra, chẳng hạn như kết hợp với kỹ thuật RAG thay vì đưa mọi thứ vào cửa sổ ngữ cảnh hay tính năng hỗ trợ cho MCP cũng mới được thêm vào SDK để phục vụ điều này.