Skip to main content

콘텐츠 도구의 프롬프트 엔지니어링: 9.8/10 품질 만드는 방법

"AI가 쓴 거 같아 보여요"라는 피드백은 모든 콘텐츠 도구의 악몽이다.

Content Repurposer를 만들면서 가장 오래 씨름한 것도 이거였다. 어떻게 하면 AI가 썼는데 AI 냄새가 안 나게 할까.

정답은 없었다. 대신 꽤 효과적인 방법들을 찾았다.


왜 프롬프트가 중요한가

LLM의 출력 품질은 모델 크기보다 프롬프트 설계에 달려 있다.

같은 Gemini 1.5 Flash로 두 가지 프롬프트를 테스트했다:

나쁜 프롬프트:

이 블로그 글을 트위터 쓰레드로 변환하세요.

→ 결과: 기계적, 모든 문장이 "~합니다" 끝남, 해시태그 남용

좋은 프롬프트:

당신은 2만 팔로워를 가진 개발자 인플루언서입니다.
아래 블로그 글의 핵심 인사이트를 트위터 쓰레드로 재구성하세요.

규칙:
- 첫 트윗은 반드시 훅으로 시작 (질문 또는 충격적 사실)
- 각 트윗 < 240자, 한 아이디어만
- 전문용어 → 구어체로 전환
- 해시태그 최대 2개만
- "저는 ~합니다" 금지, 대신 "나는 ~해봤다" 식으로

→ 결과: 실제 트위터에서 볼 법한 문체, 자연스러운 흐름


플랫폼별 페르소나 설계

각 플랫폼은 문화가 다르다. 같은 내용도 LinkedIn과 TikTok에서 쓰는 방식이 완전히 달라야 한다.

Twitter/X: 개발자 인플루언서 페르소나

  • 짧고 직접적
  • 약간의 논쟁적 뉘앙스 (engagement 유도)
  • 코드 예시나 숫자 포함 시 캡처 유도

LinkedIn: 사려 깊은 테크 리더 페르소나

  • 스토리텔링 구조 (문제 → 과정 → 교훈)
  • "I've been building..." 식 자기 경험 중심
  • 댓글 유도 질문으로 마무리

TikTok/Shorts: Gen Z 크리에이터 페르소나

  • 훅: 처음 3초에 결론 먼저
  • 구체적 숫자 (63.8초, $290 MRR)
  • 스크롤 멈추는 반전 포인트

Newsletter: 큐레이터 페르소나

  • 독자를 "당신"으로 직접 호칭
  • 왜 이게 중요한지 컨텍스트 먼저
  • CTA는 1개만 (분산 금지)

품질 자동 평가 (LLM-as-Judge)

생성만 하면 절반이다. 평가도 자동화해야 한다.

const qualityPrompt = `
다음 콘텐츠를 1-10점으로 평가하세요:

${generatedContent}

평가 기준:
1. 플랫폼 적합성 (2점): ${platform}에서 자연스러운가?
2. 오리지널리티 (2점): 원문을 단순 요약하지 않았는가?
3. 인게이지먼트 (2점): 반응을 유도하는 요소가 있는가?
4. 가독성 (2점): 문장이 명확하고 간결한가?
5. 브랜딩 (2점): 원문의 톤/메시지가 보존됐는가?

JSON으로 응답: { score: X, feedback: "...", pass: boolean }
`;

점수 7점 미만이면 자동 재시도. 프롬프트를 약간 변형해서 최대 3번까지 재생성한다.

실험 결과: 초기 생성 통과율 74%, 재시도 후 99.2%.


Chain-of-Thought 기법 적용

"그냥 해줘" 대신 "단계별로 생각하고 해줘"가 항상 더 낫다.

const prompt = `
단계별로 진행하세요:

1단계: 원문에서 핵심 주장 3가지 추출
2단계: ${platform} 독자가 가장 공감할 순서로 재배열
3단계: 각 주장을 ${platform} 문화에 맞게 재작성
4단계: 전체를 검토하고 AI 냄새가 나는 표현 교체

최종 출력만 반환하세요. 단계 설명 불필요.
`;

이 방식이 단순 변환 프롬프트 대비 품질 점수를 평균 1.8점 올렸다.


실패에서 배운 것

❌ 너무 긴 프롬프트

컨텍스트 창을 낭비하고 LLM이 집중력을 잃는다. 300토큰 이하로 유지.

❌ 예시 없이 규칙만

"짧게 써라"보다 "각 포인트는 한 문장으로, 예: '기능 X → 결과 Y'"가 훨씬 효과적.

❌ 점수 요청 없이 생성만

평가 없는 생성은 복권이다. 품질 피드백 루프 없이는 개선도 없다.


오픈소스로 확인하기

Content Repurposer의 프롬프트 전부 공개돼 있다:

프롬프트 엔지니어링은 마법이 아니다. 반복 실험과 측정이다. 9.8/10은 처음부터 나온 게 아니라 37번의 수정 끝에 나왔다.


프롬프트 개선 아이디어 있으면 PR 환영합니다 → GitHub 🥞