이전 글
이전 글에서 AI 요약 기능을 넣게 된다면 API를 쓰지 않고 오픈소스 모델을 다운받아서 미세조정을 통해 구현해보려고 했다.
결론부터 말하자면 API를 통해 구현하게 되었다. (세팅 복잡..)
내 컴퓨터에서 돌릴 수 있는 아주 작은 파라미터의 모델은 생각한 것 만큼 성능이 잘 나오지 않았고 미세조정은 숙력도가 부족해서 내가 제대로 했는지도 모르는 수준이다.
그래서 API를 통해 기능을 추가를 했다.
이제부터 AI 요약 기능을 적용한 과정에 대해 정리해보겠다
## 두 가지 선택지: 자체 모델 vs 외부 API
AI 요약 기능을 넣는 방법은 크게 두 가지였다.
- 오픈소스 모델을 내려받아 자체 서버에 띄우는 방법 (초기 비용이 크다)
- 빅테크 기업의 API를 사용하는 방법
나는 초기 비용과 운영 리스크를 최소화하고 싶었기 때문에,
오픈소스 모델 대신 API를 사용하는 쪽으로 방향을 잡았다.
---
## 주요 AI API 요금 비교
2026년 2월 기준으로, 텍스트 요약 용도에서 현실적으로 고려 가능한
저가형 모델들의 API 요금을 비교해봤다.
회사별 모델별 비용정리 - 회사 모델 입력 토큰 (1M당) 출력 토큰 (1M당)
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | 가성비 좋음 | |
| Gemini 2.5 Flash | $0.30 | $2.50 | 속도 빠름, 품질 안정 | |
| OpenAI | GPT-5 nano | $0.05 | $0.40 | 초저가, 품질은 제한적 |
| OpenAI | GPT-5 mini | $0.25 | $2.00 | 준수한 요약 품질 |
| Anthropic | Claude Haiku 4.5 | $1.00 | $5.00 | 문체 자연스러움 |
| xAI | Grok-4.1 Fast | $0.20 | $0.50 | 가성비 매우 좋음 |
이 중에서 내가 중요하게 본 기준은 딱 세 가지였다.
- 요약 품질이 실사용에 충분한가
- 토큰 단가가 낮은가 (별표 세 개!!!!!)
- API 안정성과 문서가 괜찮은가
이 기준으로 보면,
Gemini 2.5 Flash-Lite가 거의 압도적인 선택지였다.
---
## 왜 Gemini를 선택했는가
Gemini 2.5 Flash-Lite는 요약 용도에서 딱 내가 원하던 포지션이었다.
- 입력 1M 토큰당 $0.10
- 출력 1M 토큰당 $0.40
- 컨텍스트 1M 토큰
- 요약, 분류, 단순 변환 작업에 충분한 품질
게다가 Google은 다른 회사들보다무료 티어가 매우 관대한 편이었다. (무료다!)
내가 실제로 사용하려던 모델 기준 무료 한도는 다음과 같았다.
- Requests per day (RPD): 1,500
- Requests per minute (RPM): 15
- Tokens per minute (TPM): 250,000
이 정도면,
사이드 프로젝트에서 요약 기능을 붙이기에는 충분히 매력적인 조건이었다.
---
## Gemini 무료지만 한도가 있다! 악의적인 사용자가 있으면 어떡하지?!
(DAU 0이다.. 쓸데없는 걱정이지만 그래도 걱정됨)
AI API는 구조적으로 사용량이 늘어날수록 비용이 그대로 증가한다.
- 누군가가 봇을 붙여서 무한 호출하면?
- 악의적으로 대량 요청을 보내면?
- 갑자기 트래픽이 터지면?
이 모든 비용이 전부 내 카드로 청구된다.
---
## 그래서 선택한 방식: 사용자가 직접 API 키 입력
고민하다가 하나의 타협안을 떠올렸다.
Gemini는 개인 사용자도 무료 API 키를 발급받을 수 있다.
무료 티어 한도 안에서는 과금도 없다.
그래서 UX는 좀 나빠지지만, 구조를 이렇게 바꿨다.
- 사용자가 “AI 요약” 버튼을 누르면
- Google AI Studio에서
- 무료 API 키를 발급받는 방법을 안내하는 모달을 띄운다
- 사용자가 본인 API 키를 입력한다
- 그 키로 요약 요청을 실행한다
즉, 요약 비용을 서비스 운영자가 아니라 사용자 본인이 부담하는 구조다.
(무료 티어라서 사실상 0원)
---
## UX는 나빠졌지만, 이게 최선이었다
솔직히 말하면 UX는 확실히 나빠졌다.
(이거 귀찮아서 누가 쓰겠나.. 유저 입장에서 키 유출 걱정도 되겠다)
그런데도 이 방식을 선택한 이유는 단순하다.
사이드 프로젝트를 지속 가능하게 운영하려면 과금 폭탄 리스크를 0에 가깝게 만들어야 했고
기능을 아예 빼는 것보다는 불편하더라도 있는 게 낫다고 판단했다
(AI 요약 버튼을 누르면 이런 화면이 뜬다..)

'바이브 코딩 > 유튜브 자막 추출' 카테고리의 다른 글
| AI 요약 기능을 붙일지 말지 고민중이다 #3 (0) | 2026.01.11 |
|---|---|
| 운영 첫날에 본 숫자들 #2 (4) | 2026.01.08 |
| 유튜브 자막 추출 사이트를 만들어 보자 #1 (0) | 2026.01.06 |