🛠️ 채팅 응답 시스템 개선 안내
Moon- 2026-06-04 18:01:33
- 조회수2,218
안녕하세요, LUNATALK 입니다.
Gemini 모델 기반 채팅의 응답 안정성을 개선하기 위한 업데이트를 적용했습니다.
✨ 주요 변경 사항
추론(Thinking) 노출 방지 강화
기존에는 응답 형식을 가공해서 추론 내용이 화면에 새는 것을 막았는데, 이번 업데이트로 API 단에서 직접 차단하도록 변경했습니다.
- 응답 형식이 가끔 깨지던 문제가 해결됩니다.
- 응답 시작이 더 안정적이 됩니다.
⚠️ 알아두실 점 — 추론량과 응답 길이의 관계
AI 모델은 "추론 + 응답"을 합쳐 한 번에 출력 가능한 토큰 한도가 정해져 있습니다.
복잡한 시나리오에서 추론을 많이 사용한 경우, 그만큼 응답 본문 길이가 다소 짧아질 수 있습니다.
- 짧고 단순한 대화 → 추론 적음 → 충분히 긴 응답 가능
- 긴 서사 / 복잡한 시나리오 → 추론 많음 → 응답 길이가 다소 짧아질 수 있음
💡 응답이 짧다고 느껴지신다면 — 출력 부스터를 켜주세요
출력 부스터는 한 번에 출력 가능한 토큰 한도 자체를 늘려주는 기능입니다.
추론을 많이 사용하는 상황에서도 응답 본문이 풍성하게 유지됩니다.
- 채팅방 설정에서 "출력 부스터(%)" 항목을 조정하실 수 있습니다.
- 기본 출력의 초과분만 포인트가 추가 차감됩니다.
- 긴 서사 · 소설풍 응답 · 다중 NPC 시뮬레이터에서 특히 효과적입니다.
──────────────────────────
📌 영향 범위
- Gemini 모델 전체 (Pro 2.5 / 3.1, Flash 2.5 / 3.0 / 3.5 등)
- Claude 모델 : 변경 없음 (기존 그대로 동작)
이용에 참고하시어 오늘도 즐거운 채팅 되시기 바랍니다.
감사합니다.