top of page


명령어 하나로 끝내는 Air API 연동: ClawHub 플러그인 이야기
안녕하세요, 개발팀에서 DevOps/SRE를 담당하고 있는 이창윤입니다. 최근 Air API 출시와 함께 저희 팀은 인프라 모니터링 체계를 구축하고 있습니다. 이번 글에서는 그 과정에서 개발한 OpenClaw 플러그인을 소개하려고 합니다 🙂 시작하기 전에 OpenClaw를 한동안 써본 분이라면 한 번쯤 이런 상황을 겪어보셨을 겁니다. 외부 모델 프로바이더를 연결하려는 순간, 설정 메뉴를 뒤적이고 Base URL을 복사-붙여넣기 하고 사용할 모델마다 엔드포인트를 손으로 하나씩 등록하는 그 과정을요. 하다보면 동작은 하는데, 세팅이 유쾌하지는 않습니다. 이 글에서는 저희 팀이 개발한 플러그인을 통해 plugins install 명령어 하나가 이 모든 반복을 어떻게 없애는지를 소개해보도록 하겠습니다. 그리고 그 뒤에서는 실제로 무슨 코드가 돌아가는지까지도 함께 들여다보겠습니다. 기존 방식: Custom Provider, 모델마다 반복 아래 그림처럼
7일 전


가장 저렴하게 Qwen을 쓰는 방법
요즘 산업, 직무, 학계 너나할 것 없이 "나만의 AI 에이전트 비서"를 만들고 업무에 적용하고 있습니다. 그런데 막상 계속 쓰다 보면 피할 수 없는 현실과 마주하게 됩니다. 바로 비용 입니다. 월 구독료보다 비싼, 나도 모르게 쌓인 API 호출 비용이 청구서로 날아오죠. AI 에이전트는 작업 한 번에 모델을 적게는 수십에서 많게는 수백 번 호출합니다. 스스로 계획을 세우고-도구를 쓰고-결과를 검증하고-다시 호출하는 루프가 반복되기 때문이죠. 에이전트가 똑똑해질수록 API 비용이 함께 올라가는 건 어쩌면 당연한 수순입니다. 그런데 이렇게 매일 쌓이는 API 비용이 과연 지속가능할까요? 쓸수록 적자가 나는 구조라면 아무리 좋은 AI도 프로덕트에 넣기는 어렵습니다. 에이전틱 AI 시대에 우리에게 진짜 필요한 건 더 좋은 모델이 아니라, 더 저렴한 추론입니다. Air API는 바로 이 문제를 풀기 위해 만들어졌습니다. 오픈소스 모델, 에이전트 시대의
4월 10일


Air API가 출시되었습니다
오픈소스 AI 모델을 직접 서빙하려면, 모델 선택보다 인프라 세팅에 더 많은 시간이 걸립니다. GPU 확보하고, 환경 구성하고, 트래픽에 맞춰 스케일링까지 — 모델 하나 돌리기까지의 과정이 너무 깁니다. 저희 팀이 이 문제를 해결합니다! 오픈소스 AI 모델을 서버리스 API로 제공하는 서비스인 Air API를 드디어 출시하게 되었는데요, 인프라 구축 없이 API 키 하나로 바로 시작할 수 있으니까 지금 바로 테스트해보세요. 주요 특징 💡 OpenAI 호환 엔드포인트 기존에 OpenAI API를 사용하고 계셨다면, 엔드포인트 URL만 바꾸면 됩니다. 코드 수정이 거의 필요 없습니다. 💡 토큰 기반 종량제 월 고정 요금이 아닙니다. 사용한 토큰만큼만 과금됩니다. 💡 인프라 관리 불필요 GPU 확보, 모델 배포, 스케일링을 AIEEV의 분산 GPU 인프라가 처리합니다. 출시 모델 Air API는 Qwen 시리즈 3종부터 시작합니다. 앞으로 점
4월 9일


구글이 발표한 TurboQuant — "비싼 GPU 없이 LLM을 서빙하는 시대"가 가까워지고 있다
80GB GPU는 정말 필수였을까? TurboQuant가 KV 캐시를 압축하면서 LLM 추론 비용 구조가 바뀌고 있습니다.
3월 30일


에이아이브, SK AI 서밋 2025서 분산형 GPU 인프라 공개
에이아이브 (대표 박세진)가 비용 절감과 확장성을 갖춘 차세대 인공지능(AI) 인프라 모델을 제시했다. 에이아이브는 서울 코엑스에서 열린 SK AI 서밋 2025에 참가해 그래픽처리장치(GPU) 클라우드 에어클라우드를 소개했다고 12일 밝혔다. '오늘의 혁신, 내일의 도약'을 주제로 열린 이번 행사는 최태원 SK그룹 회장을 비롯해 엔비디아, 앤트로픽, 카카오 등 글로벌 AI 생태계를 이끄는 주요 인사와 기업들이 참석해 인공지능 기술의 발전 방향을 논의했다. 에이아이브는 SK텔레콤 AI 스타트업 엑셀러레이팅 프로그램 선정 기업으로, 스타트업 존에서 에어클라우드의 GPU 자동 확장 기능을 시연했다. 에어클라우드는 전 세계 개인과 기업의 유휴 GPU를 연결해 대규모 데이터센터에 대한 의존도를 낮추고, 저비용·고효율의 인공지능 추론을 실현하는 분산형 클라우드 플랫폼이다. 이를 통해 인공지능 추론 비용을 최대 80% 절감하면서도 대규모 연산을 안정적으로
2025년 11월 12일


에이아이브, 전 세계 엣지 GPU 연결한 ‘에어클라우드’ 출시… AI 추론 비용 40% 절감
베타 검증 완료·핵심 기능 업그레이드… 합리적 비용의 대규모 AI 추론 환경 제공 2025년 09월 30일 – 분산형 GPU AI 클라우드 스타트업 AIEEV(에이아이브)가 ‘Air Cloud(에어클라우드)’를 9월 정식 출시했다. Air Cloud는 대규모 데이터센터 의존 구조를 벗어나 소비자와 기업의 유휴 GPU를 연결해 저비용으로 AI 추론을 가능하게 하는 100% 분산형 추론 전용 AI 클라우드다. AIEEV는 장기적으로 전 세계 GPU와 NPU를 모두 연결해 데이터센터 없는 친환경적이고 저비용이면서도 고성능의 AI 인프라를 실현한다는 비전을 세우고 있다. AI 서비스 확산으로 추론 수요가 급증하면서 글로벌 데이터센터의 전력 소비와 인프라 비용도 크게 늘고 있다. 기존 퍼블릭 클라우드는 데이터센터를 건축해 클라우드서비스를 제공하는데, 높은 투자비와 에너지 사용률로 인해 확장 한계에 부딪히고 있다. AIEEV는 학습이 아닌 추론시장에 집중해
2025년 10월 5일
bottom of page




