top of page


명령어 하나로 끝내는 Air API 연동: ClawHub 플러그인 이야기
안녕하세요, 개발팀에서 DevOps/SRE를 담당하고 있는 이창윤입니다. 최근 Air API 출시와 함께 저희 팀은 인프라 모니터링 체계를 구축하고 있습니다. 이번 글에서는 그 과정에서 개발한 OpenClaw 플러그인을 소개하려고 합니다 🙂 시작하기 전에 OpenClaw를 한동안 써본 분이라면 한 번쯤 이런 상황을 겪어보셨을 겁니다. 외부 모델 프로바이더를 연결하려는 순간, 설정 메뉴를 뒤적이고 Base URL을 복사-붙여넣기 하고 사용할 모델마다 엔드포인트를 손으로 하나씩 등록하는 그 과정을요. 하다보면 동작은 하는데, 세팅이 유쾌하지는 않습니다. 이 글에서는 저희 팀이 개발한 플러그인을 통해 plugins install 명령어 하나가 이 모든 반복을 어떻게 없애는지를 소개해보도록 하겠습니다. 그리고 그 뒤에서는 실제로 무슨 코드가 돌아가는지까지도 함께 들여다보겠습니다. 기존 방식: Custom Provider, 모델마다 반복 아래 그림처럼
6일 전


월 몇 토큰부터 GPU를 직접 빌리는 게 더 저렴할까?
AI 서비스를 계속 운영하다 보면 언젠가 이런 궁금증에 마주하게 됩니다. "지금 우리가 API로 쓰는 게 진짜 저렴한 걸까? 아니면 그냥 GPU를 사서 직접 돌리는 게 낫지 않을까?" 모델 성능이 평준화되면서 이제 승부처는 비용이 되었습니다. 팀마다 자신의 사용량 규모에서 어느 방식이 진짜 저렴한지 계산하기 시작했고, 답은 사용량에 따라 명확히 달라집니다. 이 글에서는 AI 인프라 도입을 고민하는 팀들을 위해 세 가지 선택지의 실제 비용 구조를 숫자로 비교합니다. 세 가지 인프라 운영 방식과 비용 구조 비용을 비교하기 전에, 먼저 각 선택지의 비용 구조를 이해해야 합니다. 같아 보이는 비용도 어떤 방식으로 발생하느냐에 따라, 사용량 규모별로 유불리가 완전히 달라지기 때문입니다. 1. 서버리스 API: 쓴 만큼만 낸다 (고정비 X + 토큰당 과금) | 비용 구조 : 고정비 없음 + 토큰당 과금 토큰 단위로 사용료를 내는 방식입니다. GPU를 직접
4월 14일


가장 저렴하게 Qwen을 쓰는 방법
요즘 산업, 직무, 학계 너나할 것 없이 "나만의 AI 에이전트 비서"를 만들고 업무에 적용하고 있습니다. 그런데 막상 계속 쓰다 보면 피할 수 없는 현실과 마주하게 됩니다. 바로 비용 입니다. 월 구독료보다 비싼, 나도 모르게 쌓인 API 호출 비용이 청구서로 날아오죠. AI 에이전트는 작업 한 번에 모델을 적게는 수십에서 많게는 수백 번 호출합니다. 스스로 계획을 세우고-도구를 쓰고-결과를 검증하고-다시 호출하는 루프가 반복되기 때문이죠. 에이전트가 똑똑해질수록 API 비용이 함께 올라가는 건 어쩌면 당연한 수순입니다. 그런데 이렇게 매일 쌓이는 API 비용이 과연 지속가능할까요? 쓸수록 적자가 나는 구조라면 아무리 좋은 AI도 프로덕트에 넣기는 어렵습니다. 에이전틱 AI 시대에 우리에게 진짜 필요한 건 더 좋은 모델이 아니라, 더 저렴한 추론입니다. Air API는 바로 이 문제를 풀기 위해 만들어졌습니다. 오픈소스 모델, 에이전트 시대의
4월 10일


Air API가 출시되었습니다
오픈소스 AI 모델을 직접 서빙하려면, 모델 선택보다 인프라 세팅에 더 많은 시간이 걸립니다. GPU 확보하고, 환경 구성하고, 트래픽에 맞춰 스케일링까지 — 모델 하나 돌리기까지의 과정이 너무 깁니다. 저희 팀이 이 문제를 해결합니다! 오픈소스 AI 모델을 서버리스 API로 제공하는 서비스인 Air API를 드디어 출시하게 되었는데요, 인프라 구축 없이 API 키 하나로 바로 시작할 수 있으니까 지금 바로 테스트해보세요. 주요 특징 💡 OpenAI 호환 엔드포인트 기존에 OpenAI API를 사용하고 계셨다면, 엔드포인트 URL만 바꾸면 됩니다. 코드 수정이 거의 필요 없습니다. 💡 토큰 기반 종량제 월 고정 요금이 아닙니다. 사용한 토큰만큼만 과금됩니다. 💡 인프라 관리 불필요 GPU 확보, 모델 배포, 스케일링을 AIEEV의 분산 GPU 인프라가 처리합니다. 출시 모델 Air API는 Qwen 시리즈 3종부터 시작합니다. 앞으로 점
4월 9일
bottom of page


