Context Window
Cửa sổ ngữ cảnh
Bạn dán 200 trang tài liệu vào ChatGPT miễn phí và hỏi 'Tóm tắt giúp tôi'. Theo bạn, AI sẽ làm gì?
Context window giống bàn làm việc của AI. Bạn đặt tài liệu, câu hỏi, lịch sử hội thoại lên đó. Khi bàn đầy, tờ cũ nhất bị đẩy rơi xuống sàn — AI không còn nhìn thấy nữa.
Hoặc giống trí nhớ ngắn hạn của con người. Bạn chỉ giữ được một lượng thông tin nhất định trong đầu trước khi cái mới đẩy cái cũ ra. AI cũng vậy — mỗi mô hình có một dung lượng riêng.
Đơn vị đo là token — một mẩu chữ nhỏ. Tiếng Việt thường tốn nhiều token hơn tiếng Anh vì có dấu. Một trang A4 điển hình khoảng 600–700 token.
Không cần đếm chính xác. Chỉ cần nhớ quy đổi thô: 1 trang ≈ 700 token, 100 trang ≈ 70K token.
Hình minh họa
Chọn một mô hình AI. Bật/tắt các loại tài liệu bạn muốn "nhét" vào cuộc chat. Nếu thanh màu chuyển đỏ là vượt ngân sách — phần cuối sẽ bị AI cắt âm thầm.
Hãy tưởng tượng bạn giấu một câu bí mật ("mật khẩu wifi văn phòng là cafesang2025") vào đầu, giữa, hoặc cuối của một tài liệu dài, rồi hỏi AI tìm lại. Dưới đây là điểm thành công thực nghiệm.
Thay đổi tùy theo tài liệu ngắn hay dài — quan sát khác biệt.
Mỗi lần bạn chat, có 4 khoản luôn cùng nằm trong context. Kéo slider để thấy khoản nào ngốn nhiều nhất — và khi nào ngân sách bị vượt.
- 1 trang A4 ≈ 700 token. 100 trang ≈ 70K token.
- Luôn dành ≥ 30% ngân sách cho câu trả lời. Input chiếm tối đa 70%.
- Đặt câu hỏi quan trọng ở đầu hoặc cuối prompt, đừng chôn giữa tài liệu dài.
Sếp đưa bạn một PDF 500 trang (≈ 350K token) và bảo: 'Tóm tắt cho anh trong 1 đoạn'. Bạn chọn chiến lược nào?
Bạn hãy nối: chiến lược nào hợp với tình huống nào?
Chọn một mục bên cột A, rồi chọn mục phù hợp bên cột B để nối.
Cột A
Cột B
Giải thích
Các mô hình phổ biến 2025: ai chứa được bao nhiêu trang?
Thang log, chứ không phải tuyến tính — vì GPT-3.5 (4K) tới Gemini 1.5 (2M) chênh tới 500 lần. Hàng số bên phải là ước tính quy đổi ra trang A4.
4 cách xử lý tài liệu vượt ngân sách
Khi tài liệu của bạn vượt context của mô hình đang dùng. Không có cách duy nhất đúng — tùy tình huống.
- Context window là 'bàn làm việc' của AI — mọi thứ bạn gửi + phần AI trả lời cùng nằm trên bàn một lúc. Vượt ngân sách là tờ cũ bị đẩy xuống.
- Quy đổi thô dễ nhớ: 1 trang A4 ≈ 700 token; 100 trang ≈ 70K token. Tiếng Việt tốn thêm ~30% so với tiếng Anh.
- Các mốc 2025: GPT-3.5 miễn phí 4K (≈ 6 trang), GPT-4o 128K (200 trang), Claude 3.5 200K (310 trang), Gemini 1.5 Pro 2M (3.100 trang).
- AI đọc kỹ phần đầu và phần cuối của tài liệu dài hơn phần giữa ('lost in the middle'). Đặt câu hỏi trọng yếu ở đầu hoặc cuối.
- Khi tài liệu vượt ngân sách: chia nhỏ (chunking), đổi mô hình context lớn, dùng RAG (Claude Projects / NotebookLM), hoặc tóm tắt cuốn chiếu.
Kiểm tra hiểu biết
Context window là gì, nói theo cách dễ hiểu nhất cho người dùng văn phòng?