Trích xuất cấu trúc vượt trội so với ngữ cảnh đầy đủ (F1: 0.83 vs 0.58) trong tác vụ suy luận đa bước. Entity Cards (17.5% token) giúp mô hình suy luận tốt hơn do loại nhiễu, tập trung vào thực thể và quan hệ. Token compression (LLMLingua, QUITO) thất bại do phá vỡ cấu trúc ngữ nghĩa. Mô hình nhỏ (Qwen3-1.7B) có thể tạo Entity Cards với F1 0.60. Cần thử fine-tuning và kiểm tra trên RAG.
#StructuredExtraction #EntityCards #AIReasoning #LLM #RAG #TríchXuấtCấuTrúc #SuyLuậnAI #MôHìnhNgônNgữ #RútGọ