
1. 문제 정의
YouTube에는 요리 영상이 과잉 공급되어 있다.
그러나 다음 조건을 동시에 만족하는 콘텐츠는 드물다.
- 실제로 따라 할 수 있음
- 설명란에 텍스트 레시피가 존재
- 과도하게 복잡하지 않음
- 어느 정도 **사회적 검증(조회수)**을 통과
문제는 단순 추천이 아니라
**“자동화로 어디까지 판단할 수 있는가”**였다.
2. 설계 범위 설정 (의도적 제한)
포함
- YouTube Data API v3
- search.list, videos.list
- 제목, 설명란, 메타데이터 기반 판단
제외 (1차)
- 조회수 성장률
- 댓글 분석
- 자막/음성 분석
- DB 기반 재조회
이유:
👉 정적 데이터만으로도 설계 판단 연습이 가능하기 때문.
3. 검색 프로파일 분리
검색 조건을 코드에 직접 박지 않고
도메인 전용 프로파일로 분리했다.
cooking_simple_ko
기본 조건
- language: ko
- region: KR
- type: video
- order: viewCount
제목 필수 키워드 (OR)
- 초간단 / 간단 / 쉬운 / 누구나 / 자취
- 3분 / 5분 / 10분
- 원팬 / 전자레인지 / 에어프라이어
제목 금지 키워드 (NOT)
- 정통 / 장인 / 호텔 / 코스
- 숙성 / 발효 / 수비드 / 저온
- 셰프 / 오마카세 / 시그니처
- 하루 / 이틀 / 3일 / 12시간
👉 이 단계에서 “쉬움”을 강제한다.
4. 하드 필터 전략
“좋은 요리”를 정의하지 않고
탈락 조건만 정의한다.
하드 필터 #1 (검색 직후)
- 영상 길이 ≤ 10분
- 조회수 ≥ 10,000
- videoId 중복 제거
- 제목 규칙 통과
하드 필터 #2 (상세 조회 후)
- 설명란에 레시피 텍스트 존재
- 재료 / 준비물
- 만드는 법 / 조리 / 레시피
- 계량 단위(g, ml, 큰술 등)
- 링크만 있는 설명란 → 탈락
하드 필터 #3 (복잡성)
- 재료·단계 과다
- 특수 공정(숙성·발효 등)
- 제목은 쉬운데 설명은 복잡한 경우
5. 검사 강도의 의도적 제한
Top10 후보만 필요하므로
정교한 점수 모델은 배제했다.
자동 검사 최소 세트
- 중복
- 길이
- 조회수
- 제목 규칙
- 설명란 레시피 존재
제외
- 성장률
- 댓글 반응
- 채널 신뢰도 점수화
이유:
👉 사람이 최종 선택할 것이기 때문.
6. 결과물 포맷 (DB 없이)
1차 결과는 JSON 파일 1개다.
포함:
- 날짜
- 사용한 검색 규칙
- Top10 후보
- 각 항목의 통과 이유
의도:
- 재현 가능성
- 나중에 DB로 이관 가능
- 노코딩 도구 연계 가능
7. 중요한 설계 결정
조회수 관련 판단
- 조회수 낮음 ≠ 나쁜 영상 (동의)
- 그러나 성장률 판단은:
- 스냅샷 저장 필요
- 재조회 필요
- DB 설계 필요
👉 프로토타입 범위 초과
→ 확장판으로 명확히 분리
8. 최종 구조 요약
- 자동화: 후보 생성까지만
- 판단: 하드룰 기반 제거
- 선택: 사람(방문자)
이 시스템은 추천 엔진이 아니라
**“선별 가능한 후보를 정직하게 줄이는 엔진”**이다.
9. 설계 결론
이 프로젝트의 핵심 가치는 결과가 아니라
다음 질문에 답한 데 있다.
자동화로 할 수 있는 것과
하면 안 되는 것을 어디서 나눌 것인가?
요리는 내가 직접 검수할 수 있는 도메인이기 때문에
이 판단을 가장 빠르게 반복할 수 있었다.
기술적 한 줄 요약
이 설계는 ‘정확한 추천’을 만들지 않는다.
대신 ‘설명 가능한 선택’을 가능하게 한다.
'AI (GPT4, 로컬 LLM)' 카테고리의 다른 글
| GPT와의 토론 (3편) (0) | 2026.02.15 |
|---|---|
| GPT와의 토론 (2편) - AI로 인한 변화와 특이점 (0) | 2026.02.14 |
| GPT와의 토론 (26.02.12) - 과장된 AI (0) | 2026.02.12 |
| 아들의 까치집 머리를 보고 노래 작사 : CHAT GPT , 작곡 노래 : aisinging.ai (0) | 2026.02.03 |
| MS COPLIOT 을 써보다 (비교 CHATGPT) (1) | 2026.01.31 |