Giới hạn số lượng yêu cầu

Hạn mức sử dụng điều chỉnh số lượng yêu cầu bạn có thể gửi đến Gemini API trong một khoảng thời gian nhất định. Các giới hạn này giúp duy trì mức sử dụng hợp lý, ngăn chặn hành vi sai trái và giúp duy trì hiệu suất hệ thống cho tất cả người dùng.

Xem hạn mức sử dụng hiện tại trong AI Studio

Cách hoạt động của hạn mức

Hạn mức tỷ lệ thường được đo lường theo 3 phương diện:

  • Số yêu cầu mỗi phút (RPM)
  • Số mã thông báo mỗi phút (đầu vào) (TPM)
  • Số yêu cầu mỗi ngày (RPD)

Mức sử dụng của bạn được đánh giá dựa trên từng hạn mức và việc vượt quá bất kỳ hạn mức nào trong số đó sẽ kích hoạt lỗi giới hạn tốc độ. Ví dụ: nếu giới hạn RPM của bạn là 20, thì việc đưa ra 21 yêu cầu trong vòng một phút sẽ dẫn đến lỗi, ngay cả khi bạn chưa vượt quá TPM hoặc các giới hạn khác.

Hạn mức sử dụng được áp dụng cho mỗi dự án, chứ không phải cho mỗi khoá API. Hạn mức số yêu cầu mỗi ngày (RPD) sẽ được đặt lại vào lúc nửa đêm theo giờ Thái Bình Dương.

Hạn mức sẽ khác nhau tuỳ thuộc vào mô hình cụ thể đang được sử dụng và một số hạn mức chỉ áp dụng cho một số mô hình cụ thể. Ví dụ: Số hình ảnh mỗi phút (IPM) chỉ được tính cho các mô hình có khả năng tạo hình ảnh (Imagen 3), nhưng về mặt khái niệm thì tương tự như số mã thông báo mỗi phút (TPM). Các mô hình khác có thể có giới hạn về số lượng mã thông báo mỗi ngày (TPD).

Các mô hình thử nghiệm và mô hình xem trước có giới hạn về tốc độ chặt chẽ hơn.

Cấp sử dụng

Giới hạn về tốc độ được gắn với cấp sử dụng của dự án. Khi mức sử dụng và mức chi tiêu API tăng lên, bạn sẽ có thể nâng cấp lên cấp cao hơn với hạn mức tốc độ cao hơn.

Điều kiện để đạt được Cấp 2 và Cấp 3 dựa trên tổng mức chi tiêu tích luỹ cho các dịch vụ của Google Cloud (bao gồm nhưng không giới hạn ở Gemini API) đối với tài khoản thanh toán được liên kết với dự án của bạn.

Bậc Điều kiện ứng tuyển
Miễn phí Người dùng ở các quốc gia đủ điều kiện
Cấp 1 Tài khoản thanh toán trả phí đầy đủ được liên kết với dự án
Cấp 2 Tổng mức chi tiêu: > 2.500.000 VND và ít nhất 30 ngày kể từ khi thanh toán thành công
Cấp 3 Tổng mức chi tiêu: > 1.000 USD và ít nhất 30 ngày kể từ khi thanh toán thành công

Khi bạn yêu cầu nâng cấp, hệ thống tự động bảo vệ khỏi hành vi sai trái của chúng tôi sẽ thực hiện các bước kiểm tra bổ sung. Mặc dù việc đáp ứng các tiêu chí đủ điều kiện đã nêu thường là đủ để được phê duyệt, nhưng trong một số trường hợp hiếm gặp, yêu cầu nâng cấp có thể bị từ chối dựa trên các yếu tố khác được xác định trong quá trình xem xét.

Hệ thống này giúp duy trì tính bảo mật và tính toàn vẹn của nền tảng Gemini API cho tất cả người dùng.

Giới hạn số lượng yêu cầu của Gemini API

Hạn mức phụ thuộc vào nhiều yếu tố (chẳng hạn như cấp hạn mức của bạn) và bạn có thể xem hạn mức trong Google AI Studio. Khi cấp và trạng thái tài khoản của bạn thay đổi theo thời gian, giới hạn về tốc độ sẽ tự động được cập nhật.

Xem hạn mức sử dụng hiện tại trong AI Studio

Chúng tôi không đảm bảo hạn mức tốc độ được chỉ định và dung lượng thực tế có thể khác.

Hạn mức yêu cầu theo lô của API

Các yêu cầu Batch API phải tuân theo giới hạn tốc độ riêng, tách biệt với các lệnh gọi API không theo lô.

  • Số yêu cầu theo lô đồng thời: 100
  • Giới hạn kích thước tệp đầu vào: 2 GB
  • Hạn mức lưu trữ tệp: 20 GB
  • Số lượng mã thông báo được xếp hàng đợi trên mỗi mô hình: Bảng Số lượng mã thông báo được xếp hàng đợi theo lô liệt kê số lượng mã thông báo tối đa có thể được xếp hàng đợi để xử lý theo lô trên tất cả các lô công việc đang hoạt động của bạn cho một mô hình nhất định.

Cấp 1

Mô hình Mã thông báo được xếp hàng theo lô
Mô hình xoá văn bản
Bản dùng thử Gemini 3 Pro 50.000.000
Gemini 2.5 Pro 5.000.000
Gemini 2.5 Flash 3.000.000
Bản xem trước Gemini 2.5 Flash 3.000.000
Gemini 2.5 Flash-Lite 10.000.000
Bản xem trước Gemini 2.5 Flash-Lite 10.000.000
Gemini 2.0 Flash 10.000.000
Gemini 2.0 Flash-Lite 10.000.000
Mô hình tạo nội dung đa phương thức
Bản xem trước hình ảnh của Gemini 3 Pro 🍌 2.000.000

Cấp 2

Mô hình Mã thông báo được xếp hàng theo lô
Mô hình xoá văn bản
Bản dùng thử Gemini 3 Pro 500.000.000
Gemini 2.5 Pro 500.000.000
Gemini 2.5 Flash 400.000.000
Bản xem trước Gemini 2.5 Flash 400.000.000
Gemini 2.5 Flash-Lite 500.000.000
Bản xem trước Gemini 2.5 Flash-Lite 500.000.000
Gemini 2.0 Flash 1.000.000.000
Gemini 2.0 Flash-Lite 1.000.000.000
Mô hình tạo nội dung đa phương thức
Bản xem trước hình ảnh của Gemini 3 Pro 🍌 270.000.000

Cấp 3

Mô hình Mã thông báo được xếp hàng theo lô
Mô hình xoá văn bản
Bản dùng thử Gemini 3 Pro 1.000.000.000
Gemini 2.5 Pro 1.000.000.000
Gemini 2.5 Flash 1.000.000.000
Bản xem trước Gemini 2.5 Flash 1.000.000.000
Gemini 2.5 Flash-Lite 1.000.000.000
Bản xem trước Gemini 2.5 Flash-Lite 1.000.000.000
Gemini 2.0 Flash 5.000.000.000
Gemini 2.0 Flash-Lite 5.000.000.000
Mô hình tạo nội dung đa phương thức
Bản xem trước hình ảnh của Gemini 3 Pro 🍌 1.000.000.000

Cách nâng cấp lên cấp độ tiếp theo

Gemini API sử dụng dịch vụ Thanh toán trên Cloud cho tất cả các dịch vụ thanh toán. Để chuyển từ cấp Miễn phí sang cấp trả phí, trước tiên, bạn phải bật tính năng Thanh toán trên đám mây cho dự án của mình trên Google Cloud.

Sau khi dự án của bạn đáp ứng các tiêu chí được chỉ định, dự án đó sẽ đủ điều kiện nâng cấp lên cấp độ tiếp theo. Để yêu cầu nâng cấp, hãy làm theo các bước sau:

Sau khi xác thực nhanh, dự án sẽ được nâng cấp lên cấp độ tiếp theo.

Yêu cầu tăng hạn mức

Mỗi biến thể mô hình đều có một hạn mức liên kết (số yêu cầu mỗi phút, RPM). Để biết thông tin chi tiết về các giới hạn tốc độ đó, hãy xem phần Các mô hình Gemini.

Yêu cầu tăng giới hạn tốc độ cho cấp có tính phí

Chúng tôi không đảm bảo sẽ tăng hạn mức sử dụng cho bạn, nhưng chúng tôi sẽ cố gắng hết sức để xem xét yêu cầu của bạn.