Skip to content

TokenMeter — Quota AI theo workspace

Theo dõi tiêu thụ AI per workspace, top-up khi cần, allocation theo member. Route: /tokens.

Khái niệm

Token là đơn vị quota cho mọi AI call: trợ lý chat, trích xuất chứng từ, gợi ý HS Code, classify ảnh, v.v. 1 token ≈ 4 ký tự text + cost gọi model.

Cách tính token:

  • Input + output đều count — model trả về cụ thể từng request
  • Mỗi operation có cost khác nhau (chat ~200, OCR full ~1.500)
  • Pool theo workspace, share giữa thành viên
  • Reset vào ngày renewal subscription

Khác với credit / point

Token là số tự nhiên reset hàng tháng. Khác với credit mua thêm (top-up wallet) — credit không reset, dùng đến hết.

Theo dõi

TokenMeter trong topbar hiển thị số dư còn lại theo workspace hiện hành. Click để mở dashboard chi tiết.

Ví dụ trạng thái token:

Chỉ sốGiá trịGhi chú
Đã dùng3.250 token65% quota tháng
Còn lại1.750 tokenĐủ ~5 ngày với tốc độ hiện tại
Ngày reset15/07/2026Ngày renewal subscription
Trang Tokens
Trang /tokens — chart consumption 30 ngày, breakdown theo module

Top-up

Mua thêm token ngoài gói khi sắp hết. Gói top-up không reset hàng tháng — dùng đến hết.

Các gói top-up:

GóiTokenGiáĐơn giá / token
Nhỏ1.00099.000 ₫99 ₫
Vừa5.000449.000 ₫89 ₫
Lớn20.0001.599.000 ₫79 ₫ (tiết kiệm nhất)

Luồng mua top-up:

Chọn gói → QR SePay → Chuyển khoản → Token cộng vào wallet

Auto top-up

Bật auto top-up trong settings → khi token còn < 200, hệ thống tự mua gói nhỏ. Tránh gián đoạn workflow AI.

Allocation

Workspace OWNER có thể chia quota theo thành viên — chống lạm dụng, track usage per user.

Per-user cap:

  • Default: pooled (mọi member share quota workspace)
  • Có thể set cap per user (ví dụ: 500 token / member)
  • Vượt cap → request block, prompt OWNER nâng cap
  • Audit log mỗi consumption — trace ai dùng cho operation gì

Cách cấu hình:

  1. Vào /settings/workspace → tab Token allocation
  2. Bật Per-user cap
  3. Đặt cap cho từng thành viên
  4. Lưu — áp dụng ngay lập tức

Lịch sử

Lịch sử consumption granular theo từng AI call. Filter theo: ngày, module, user, operation.

Ví dụ log consumption:

Thời gianUserModuleOperationToken
03/06 14:22admin@...ChatTrả lời CO form D320
03/06 14:15member1@...DocumentsOCR Invoice full1.420
03/06 13:50member2@...HS CodeAI classify ảnh680
03/06 13:30admin@...DeclarationsSuggest cost adjustment240

Thời hạn lưu lịch sử

Lịch sử giữ 90 ngày trên gói Pro, 180 ngày trên Business, vĩnh viễn trên Enterprise.

Chi phí token theo từng thao tác

Mỗi loại AI call tiêu thụ số token khác nhau tuỳ độ phức tạp:

Thao tácToken tiêu thụGhi chú
Trích xuất chứng từ — PDF có text layer~300 / trangPDF digital (không scan)
Trích xuất chứng từ — PDF scan / ảnh~1.500 / trangOCR + image analysis
Trích xuất chứng từ — XLSX/DOCX~200 / fileStructured format
Chat trợ lý — câu hỏi thông thường~200 / lượtInput + output
Chat trợ lý — phân tích tài liệu dài~800–2.000 / lượtKèm context document
AI phân loại mã HS~150 / mặt hàngRAG top-5 context
AI gợi ý chi cục hải quan~100 / lần
AI dịch + HS Code hàng loạt~150 × số dòngPer item
AI trích xuất bảng giá (Rate Card)~500–1.000 / trangPDF hãng tàu

Tiết kiệm token

  • Upload PDF có text layer (không scan) giảm 5× token so với scan
  • Dùng cache: cùng file không mất token lần 2 (TTL 7 ngày)
  • Đặt câu hỏi súc tích trong chat thay vì dài dòng

Cơ chế dual-store (Redis + PostgreSQL)

Token balance được lưu ở 2 nơi đồng thời để đảm bảo tốc độ và độ bền:

StoreVai tròĐặc điểm
RedisĐọc/ghi nhanhINCRBY atomic — hàng nghìn ops/giây
PostgreSQLLedger bền vữngAudit trail đầy đủ, không mất khi Redis restart

Charge flow (khi AI call thành công):

AI call hoàn thành → INCRBY Redis -N → INSERT ledger PG

Charge chỉ xảy ra sau khi AI call thành công — không bị trừ token cho call thất bại hay timeout.

Reconciliation: Mỗi giờ một cron job so sánh Redis balance với tổng ledger PG. Nếu lệch → cảnh báo admin và tự correction.

Rate limit

Ngoài token balance, hệ thống có rate limit theo tần suất:

Giới hạnGiá trị
Trích xuất chứng từ50 lần / user / ngày
Chat AI200 tin nhắn / user / ngày
HS Code classify100 lần / user / ngày

Rate limit tính per-user, reset lúc 00:00 UTC+7. Khi vượt giới hạn nhận lỗi RATE_LIMIT_EXCEEDED — không tốn thêm token.

FREE tier — token tự động cấp phát

Gói FREE nhận 500 token miễn phí mỗi ngày, tự động reset lúc 00:00:

  • Token FREE hết hạn cuối ngày — không tích luỹ sang ngày hôm sau
  • Token top-up (mua thêm) không hết hạn — dùng đến hết
  • Thứ tự dùng: token subscription quota trước, sau đó top-up, cuối cùng FREE daily