top of page


GPU 자원을 추론 API로 바꾸는 법
유휴 GPU를 API Capacity로 바꾸는 Distributed GPU Cloud 이야기, 그리고 Ray 💡 핵심 메시지 "아무리 좋은 GPU도 API로 전환되지 않으면 가치가 없습니다." Aircloud는 인프라 하드웨어가 실제 서비스 레이어로 도달할 수 있도록 런타임부터 플랫폼 계층까지의 모든 파이프라인을 연결합니다. 들어가며 요즘 AI 인프라를 이야기하면 가장 먼저 나오는 키워드는 GPU shortage입니다. H100을 얼마나 확보했는지, B200 수급은 어떤지, 데이터센터 전력은 충분한지 같은 이야기가 자연스럽게 따라옵니다. 하지만 실제 서비스를 만들고 운영하다 보면, 문제는 단순히 “GPU가 부족하다”에서 끝나지 않습니다. GPU가 부족한 것도 맞지만, 동시에 이미 존재하는 GPU가 항상 잘 활용되고 있는 것도 아닙니다. 어떤 GPU는 요청이 몰려 과부하 상태이고, 어떤 GPU는 비어 있습니다. 평균 GPU utilization은
5월 29일


에어클라우드 4월 업데이트
AirCloud의 4월 릴리스는 AI 워크로드를 더 빠르게 실행하고, 더 안정적으로 운영하며, 보유 GPU 자원까지 유연하게 활용할 수 있도록 하는 데 초점을 맞췄습니다. 이번 업데이트에는 Air Container 운영 기능 강화, Air API 정식 GA, Resource Provider, RP 지원, 그리고 지능형 스케줄러 도입이 포함됩니다. 개발자는 컨테이너 접속과 로그 확인, 오류 대응, API 연동을 더 간단하게 처리할 수 있고, 기업·기관·GPU 보유 사업자는 보유 GPU 자원을 AirCloud 리소스 풀에 연결해 더 유연하게 활용할 수 있습니다. 1. Air Container 기능 보강 AI 워크로드를 운영할 때 가장 자주 필요한 작업은 컨테이너에 접속하고, 로그를 확인하고, 문제 상황을 빠르게 파악하는 것입니다. 이번 릴리스에서는 Air Container의 접속성, 운영 가시성, 제어 편의성을 전반적으로 개선했습니다. SSH 접속 지
4월 29일


명령어 하나로 끝내는 Air API 연동: ClawHub 플러그인 이야기
안녕하세요, 개발팀에서 DevOps/SRE를 담당하고 있는 이창윤입니다. 최근 Air API 출시와 함께 저희 팀은 인프라 모니터링 체계를 구축하고 있습니다. 이번 글에서는 그 과정에서 개발한 OpenClaw 플러그인을 소개하려고 합니다 🙂 시작하기 전에 OpenClaw를 한동안 써본 분이라면 한 번쯤 이런 상황을 겪어보셨을 겁니다. 외부 모델 프로바이더를 연결하려는 순간, 설정 메뉴를 뒤적이고 Base URL을 복사-붙여넣기 하고 사용할 모델마다 엔드포인트를 손으로 하나씩 등록하는 그 과정을요. 하다보면 동작은 하는데, 세팅이 유쾌하지는 않습니다. 이 글에서는 저희 팀이 개발한 플러그인을 통해 plugins install 명령어 하나가 이 모든 반복을 어떻게 없애는지를 소개해보도록 하겠습니다. 그리고 그 뒤에서는 실제로 무슨 코드가 돌아가는지까지도 함께 들여다보겠습니다. 기존 방식: Custom Provider, 모델마다 반복 아래 그림처럼
4월 16일




유휴 GPU 연결해 AI 인프라 비용 절감, 분산 클라우드 전문 스타트업 에이아이브의 도전
유휴 GPU 연결해 AI 인프라 비용 절감, 분산 클라우드 전문 스타트업 에이아이브의 도전
2025년 11월 23일


에이아이브, 전 세계 엣지 GPU 연결한 ‘에어클라우드’ 출시… AI 추론 비용 40% 절감
베타 검증 완료·핵심 기능 업그레이드… 합리적 비용의 대규모 AI 추론 환경 제공 2025년 09월 30일 – 분산형 GPU AI 클라우드 스타트업 AIEEV(에이아이브)가 ‘Air Cloud(에어클라우드)’를 9월 정식 출시했다. Air Cloud는 대규모 데이터센터 의존 구조를 벗어나 소비자와 기업의 유휴 GPU를 연결해 저비용으로 AI 추론을 가능하게 하는 100% 분산형 추론 전용 AI 클라우드다. AIEEV는 장기적으로 전 세계 GPU와 NPU를 모두 연결해 데이터센터 없는 친환경적이고 저비용이면서도 고성능의 AI 인프라를 실현한다는 비전을 세우고 있다. AI 서비스 확산으로 추론 수요가 급증하면서 글로벌 데이터센터의 전력 소비와 인프라 비용도 크게 늘고 있다. 기존 퍼블릭 클라우드는 데이터센터를 건축해 클라우드서비스를 제공하는데, 높은 투자비와 에너지 사용률로 인해 확장 한계에 부딪히고 있다. AIEEV는 학습이 아닌 추론시장에 집중해
2025년 10월 5일
bottom of page
