기본 콘텐츠로 건너뛰기

클로드 AI로 블로그 글쓰기, 시행착오 끝에 찾은 7단계 루틴

  처음 클로드(Claude)를 블로그 운영에 도입했을 때, 솔직히 기대보다 실망이 컸습니다. 생성형 AI가 써준 글을 그대로 올렸다가 방문자 수가 뚝 떨어졌던 아픈 기억이 있거든요. 당시엔 단순히 '글 좀 써줘'라고만 하면 그럴듯한 포스팅이 나올 줄 알았죠. 하지만 3개월간 매일같이 프롬프트를 수정하고 검수 방식을 바꿔가며 내린 결론은, AI는 '대필 작가'가 아니라 '똑똑한 비서'로 부려야 한다는 점입니다. 오늘은 효율적인 블로그 운영을 위해 제가 실제로 적용하고 있는 7단계 실전 가이드를 공유해 보겠습니다. 초반 기획의 함정: 키워드와 페르소나 설정 무작정 글을 쓰게 시키기 전에, 클로드에게 블로그의 정체성과 타겟 독자를 확실히 주입하는 것이 첫 번째 단계입니다. 처음에는 블로그의 정체성 따위는 생각하지 않고 무조건 검색량 높은 키워드만 쫓았습니다. 결과는 참담했죠. 특정 분야의 전문성을 꾸준히 보여주지 않으니 검색 엔진도 제 글을 신뢰하지 않더라고요. 3개월 차에 접어들며 클로드에게 'IT 분야 실무 경험을 바탕으로 30대 초보 개발자에게 눈높이 설명을 해주는 튜터'라는 역할을 부여했습니다. 이렇게 페르소나를 정해주니 답변의 결 자체가 달라졌습니다. 검색량뿐만 아니라, 실제 독자가 어떤 고민을 하고 있는지 질문하는 과정을 덧붙였더니 클릭률이 눈에 띄게 올라갔습니다. 여러분도 클로드에게 '지식 전달자' 이상의 역할을 부여해 보세요. 프롬프트 설계부터 초안 생성까지의 디테일 전체 글을 한 번에 뽑아내려 하지 마세요. 클로드와의 협업은 섹션 단위의 계단식 접근이 가장 효율적입니다. 개요를 먼저 잡고, 본문의 소제목별로 하나씩 질문을 던지는 방식을 택했습니다. 처음엔 이게 시간 낭비처럼 느껴졌습니다. 하지만 한 번에 작성하면 전체적인 문맥이 뭉개지거나, AI 특유의 뻔한 서론으로 시작하는 경우가 많더라고요. 실제로 한 섹션을 맡길 때마다 "내 경험담을 섞어줄 테니 내용을 더 풍성...

바이브 코딩의 시대, Karpathy가 제시한 에이전틱 엔지니어링 5가지 핵심

 썸네일

처음 AI 코딩 도구를 접했을 때만 해도 모든 게 마법 같았습니다. 단순히 자연어로 질문을 던지면 코드가 완성되는 이른바 바이브 코딩의 시대를 경험하며, 개발의 난이도가 획기적으로 낮아졌다고 믿었죠. 하지만 3개월 정도 복잡한 프로젝트에 이 도구들을 투입해보니 현실은 달랐습니다. 엉뚱한 라이브러리를 가져오거나, 맥락을 놓치고 엉뚱한 함수를 짜내는 상황이 빈번해지더군요. 그때 문득 Andrej Karpathy의 강연을 보게 되었고, 단순히 도구에 의존하는 단계를 넘어 에이전틱 엔지니어링이라는 구조적 접근이 필요하다는 걸 뼈저리게 깨달았습니다.


계층적 AI 구조 도식

Agent와 Sub-Agent의 계층적 위임

단순 챗봇을 넘어 에이전트의 위계 구조를 설계하는 것이 핵심입니다. 하나의 거대한 프롬프트에 모든 걸 맡기는 대신, 작업을 세분화하여 각 에이전트에게 권한을 나누어주는 방식이죠.


실무에서 경험한 가장 큰 실패는 하나의 에이전트에게 전체 로직을 다 맡기는 것이었습니다. 초반 2주 동안은 잘 돌아가는 듯했지만, 에이전트가 처리해야 할 컨텍스트가 늘어날수록 결정의 질이 급격히 떨어지더군요. 결국 저는 작업을 에이전트와 서브 에이전트로 쪼개기 시작했습니다. 예를 들어 코드 생성 에이전트와 코드 검증 에이전트를 분리하고, 상위 에이전트가 전체 계획을 잡고 서브 에이전트에게 실행을 병렬로 요청하는 방식(Fan-out/Fan-in)을 적용했죠. 이렇게 구조를 나누고 나니, 에이전트가 겪던 소위 '중간 정보 유실(Lost-in-the-Middle)' 문제가 눈에 띄게 줄어들었습니다.


복잡한 로직이 담긴 프롬프트 설계

프롬프트를 넘어서는 컨텍스트 엔지니어링

컨텍스트는 단순히 글자 수를 채우는 것이 아닙니다. 시스템, 대화, 툴이라는 3단계 레이어를 설계하고 이를 CLAUDE.md 같은 문서로 문서화하여 에이전트가 항상 최상의 상태를 유지하게 만드는 전략이 필수입니다.


많은 분이 프롬프트만 잘 짜면 된다고 생각합니다. 하지만 실제로는 비용과 신호 강도, 캐시 효율이라는 3중 압박을 관리하는 것이 진짜 엔지니어링입니다. 컨텍스트가 너무 길어지면 에이전트는 오히려 중요한 신호를 놓치기 시작하거든요.

개발자가 AI 툴을 사용하는 모습

Tool과 MCP, 에이전트의 손과 발

MCP(Model Context Protocol)는 에이전트 생태계의 USB-C 포트와 같습니다. 이제 에이전트는 자신만의 고립된 환경에서 벗어나 외부 데이터와 시스템을 표준화된 방식으로 자유롭게 호출할 수 있습니다.


처음 툴을 설계할 때 저는 모든 권한을 에이전트에게 주었습니다. 결과는 끔찍했죠. 파일 삭제 권한을 가진 에이전트가 실수로 로그 파일을 통째로 날려버린 적이 있었습니다. 이후에는 '최소 권한의 원칙'을 철저히 지키기로 했습니다. 툴을 만들 때는 검증 단계와 에러 핸들링 로직을 반드시 포함했고, 에이전트가 툴을 사용하기 전 단계에서 휴먼 피드백을 한 번 더 거치도록 안전장치를 설계했습니다. MCP라는 표준화된 인터페이스를 활용하니, 이제는 확장성 고민 없이도 필요한 기능을 언제든 덧붙일 수 있게 되더군요.


표준화된 기술 규격 아이콘

자주 묻는 질문(FAQ) ❓

바이브 코딩과 에이전틱 엔지니어링의 결정적 차이는 무엇인가요?

구조화된 예측 가능성입니다. 바이브 코딩은 운에 맡기는 느낌이라면, 에이전틱 엔지니어링은 계획과 검증 루프를 통해 에이전트의 행동을 시스템적으로 통제하고 개선하는 과정입니다.

MCP가 실제로 그렇게 중요한가요?

표준화가 주는 생산성 차이가 큽니다. 예전에는 각 서비스마다 툴을 따로 만들어야 했지만, 이제는 MCP 규격만 맞추면 어떤 서비스든 에이전트가 즉시 도구로 활용할 수 있어 연결 비용이 획기적으로 줄어듭니다.


AI와 협업하는 현대적 작업환경

엔지니어링의 본질로 돌아가며

결국 에이전틱 엔지니어링은 AI에게 모든 것을 떠넘기는 게 아니라, AI를 어떻게 하면 더 똑똑한 조력자로 세울지 고민하는 과정입니다. 오늘 소개한 5가지 개념을 하나씩 실제 워크플로우에 적용해보세요. 처음엔 위임의 스펙트럼이 낯설게 느껴질 수 있지만, 이 과정을 반복하다 보면 AI와 함께 일하는 직감이 자연스럽게 길러질 것입니다. 이제 막연한 기대를 멈추고, 더 정교한 시스템을 설계하는 에이전틱 엔지니어링으로 나아갈 때입니다.


본 글은 Andrej Karpathy의 강연 및 에이전틱 엔지니어링 관련 이론을 실무적 관점에서 해석한 콘텐츠입니다. AI 기술은 빠르게 변화하므로, 실제 프로젝트 적용 시 최신 공식 문서와 기술 사양을 반드시 확인하시기 바랍니다. 시스템 설계에 어려움이 있다면 관련 전문가나 커뮤니티와 상담하시길 권장합니다.


댓글

이 블로그의 인기 게시물

맥미니 살까 고민했던 과거의 나를 말리고 싶은 이유: 로컬 LLM 찍먹 대실패기

  오픈클로(OpenClaw)를 활용해 나만의 비서 '쟈비스'를 만들겠다는 야심 찬 계획을 세웠던 건 정확히 2주 전이었습니다. 유료 API 비용이 아까워 머리를 굴리다 '로컬 LLM이면 공짜 아닌가?'라는 결론에 도달했죠. 학복스 맥미니 가격표를 보며 고민하던 그 밤, 저는 일단 집에 있던 램 16GB 데스크톱으로 테스트를 시작했습니다. 결론부터 말씀드리면, 이건 제 시간과 뇌세포를 갈아 넣은 거대한 삽질이었습니다. 로컬 환경에서 마주한 처참한 현실: 빡대가리 논란 로컬 LLM은 우리가 기대하는 챗GPT급의 성능과는 완전히 다른 세상의 물건입니다. 기대를 낮추고 시작해도 결국 실망하게 되는 그 간극을 직접 확인했습니다. 처음에는 Ollama를 통해 Qwen2.5를 비롯한 온갖 모델을 다 깔아봤습니다. 8B, 14B는 물론이고 0.5B 같은 초경량 모델까지 램 한도 내에서 다 돌려봤죠. 그런데 한국어를 시키면 갑자기 힌두어를 섞어 쓰거나, 아예 침묵으로 일관하더군요. 프롬프트를 분명 한국어로 설정했는데도 모델 스스로가 한국어의 문맥을 전혀 파악하지 못했습니다. 설정의 문제가 아니었습니다. 모델이 작으면 머리가 나쁘고, 크면 한국어를 못 하는 모순적인 상황이 매번 반복되더군요. 램 16GB라는 제약 안에서 제가 시도했던 그 모든 새벽의 사투가 무색해지는 순간이었습니다. 왜 고사양 맥미니가 답이 아닐 수 있을까 하드웨어 사양을 높인다고 해서 로컬 LLM의 근본적인 추론 능력이 비약적으로 상승하는 것은 아닙니다. 쟈비스를 만드는 데 하드웨어가 전부는 아니라는 걸 깨달았습니다. 많은 분이 맥미니 32GB나 64GB를 사면 로컬 LLM이 엄청나게 똑똑해질 거라 믿지만, 실제로는 그렇지 않습니다. 로컬 LLM은 '기억력'은 좋지만 '사고력'이 부족한 기계에 가깝습니다. 저는 데스크톱에서 서버로 JSON 코드를 보내는 간단한 테스트조차 모델이 수행하지 못해 계속 오류를 뿜어내는 걸 보면서 깊은 현타를 느꼈습니다. ...

알파고의 진짜 유산: 바둑을 넘어 신약개발의 미래를 보다

  기억하시나요? 10년 전, 구글 딥마인드의 알파고가 바둑판 위에서 인간을 상대로 승리를 거뒀던 그 날의 충격을 말입니다. 당시 저는 사무실 모니터 앞에 멍하니 앉아 그 '37번째 수'를 보며 전율했던 기억이 납니다. 그건 단순한 게임의 승리가 아니었습니다. 기계가 인간의 직관이라는 영역을 어떻게 넘어서는지, 그 서늘하면서도 경이로운 전환점을 목격했으니까요. 하지만 알파고는 그저 시작에 불과했습니다. 알파고가 생물학 연구실에 가져온 나비효과 알파고의 핵심은 승리가 아니라, 미지의 문제를 푸는 창의적 방식에 있었습니다. 그 흐름은 이제 단백질 구조를 해석하고 신약을 설계하는 과학계의 거대한 혁명으로 이어졌습니다. 현업에서 연구 데이터를 다루다 보면, 가장 큰 벽은 언제나 복잡성입니다. 단백질 구조 하나를 밝히는 데 몇 년씩 걸리던 시절이 있었습니다. 하지만 구글 딥마인드의 푸시미트 콜리 부사장의 인터뷰를 보며 느낀 점은, AI가 이제는 예측을 넘어선 '설계자'가 되었다는 사실입니다. 알파폴드(AlphaFold)는 이미 330만 명이 넘는 연구자들의 일상이 되었습니다. 제 주변의 생물학자 동료들도 이제는 실험실에 들어가기 전, AI가 예측한 구조를 바탕으로 가설을 세우는 것을 당연하게 여깁니다. 알파고 때 우리가 봤던 그 '창의적인 수'들이 생명 현상을 읽는 언어로 번역된 셈입니다. 인공지능이 인간을 대체하는 것이 아니라, 인간의 질문 수준을 한 단계 높여주고 있다는 점이 중요합니다. 예측이 쉬워지니 연구자들은 더 깊은 과학적 난제를 고민하게 되었습니다. 유전체 해석과 알고리즘의 최적화 AlphaMissense와 같은 모델은 단순히 데이터를 나열하지 않습니다. DNA 변이가 생명체에 미치는 영향을 판별하며 유전체 연구의 새로운 지평을 열고 있습니다. 데이터를 다루는 사람으로서 가장 흥미로웠던 것은 AlphaEvolve의 성과입니다. 사실 알고리즘을 최적화한다는 건 지루하고 반복적인 작업이거든요. 하지만 AI가 스...

내 책상 위에서 GPT-4급 성능을? Qwen 3.5 로컬 구동 도전기

  처음 397B 파라미터 모델이 로컬 환경에서 돌아간다는 소식을 접했을 때, 솔직히 반신반의했습니다. 단순히 수치만 높은 게 아닐까 싶어 퇴근길에 24GB VRAM을 장착한 제 메인 PC에 바로 Qwen 3.5 9B 모델을 올려봤는데, 그 속도와 답변 품질을 보고 화면 앞에서 잠시 멍하니 앉아있었습니다. 그동안 제가 클라우드 API에 썼던 비용과 시간이 조금 허무하게 느껴질 정도더군요. 오늘은 로컬 LLM이 단순한 장난감을 넘어 실무의 영역으로 들어온 지금, 우리가 무엇을 준비해야 하는지 제 시행착오를 담아 정리해 보려 합니다. MoE와 Dense 모델, 무엇을 고를까? Qwen 3.5는 모델 라인업이 방대해서 처음엔 무엇부터 써야 할지 막막할 수 있습니다. 하지만 하드웨어 제약 내에서 최적의 효율을 내는 구조를 이해하면 선택지는 명확해집니다. 많은 분이 397B 모델의 웅장한 성능에만 집중하지만, 실질적으로 우리 PC에서 생명력 있게 돌아가는 건 MoE(Mixture of Experts) 모델들입니다. 저는 처음에 무리하게 35B-A3B 모델을 돌려보려다 램 부족으로 시스템이 멈추는 바람에 꽤 고생했습니다. 핵심은 '활성화 파라미터'인데, 35B 전체 크기라도 실제 연산은 3B만 사용하니 놀라울 정도로 가벼웠죠. 무조건 큰 모델이 최고라는 생각은 버려야 합니다. 내 하드웨어에서 초당 토큰 생성 속도가 10 이상 유지되는 모델이 가장 실용적인 모델입니다. 현장에서 체감한 양자화와 하드웨어의 함정 양자화는 메모리를 절약하는 마법이지만, 그 종류가 너무 많아 선택 장애를 유발합니다. 수치만 보고 결정하면 나중에 성능 저하 때문에 곤란해질 수 있습니다. 저도 처음엔 무조건 제일 작은 2비트 버전으로 모든 걸 해결하려 했습니다. 하지만 막상 코딩 작업에 투입해보니 엉뚱한 라이브러리를 불러오거나 문법을 틀리는 빈도가 확연히 높더군요. 4비트 양자화 모델이 용량 대비 품질 유지 측면에서 압도적입니다. 또한, GPU 오프로딩을 할 때도 주의가 필요합니다. ...