top of page

가격
회사
문서
블로그

지금 시작하세요

블로그

AIEEV Blog

에이아이브의 최신 소식을 확인하세요

→ 뉴스레터 구독하기

All Posts
Newsroom
Product
Inside AIEEV
Customer Stories
Engineering

GPU 자원을 추론 API로 바꾸는 법

GPU 자원을 추론 API로 바꾸는 법

GPU 자원을 추론 API로 바꾸는 법

유휴 GPU를 API Capacity로 바꾸는 Distributed GPU Cloud 이야기, 그리고 Ray 💡 핵심 메시지 "아무리 좋은 GPU도 API로 전환되지 않으면 가치가 없습니다." Aircloud는 인프라 하드웨어가 실제 서비스 레이어로 도달할 수 있도록 런타임부터 플랫폼 계층까지의 모든 파이프라인을 연결합니다. 들어가며 요즘 AI 인프라를 이야기하면 가장 먼저 나오는 키워드는 GPU shortage입니다. H100을 얼마나 확보했는지, B200 수급은 어떤지, 데이터센터 전력은 충분한지 같은 이야기가 자연스럽게 따라옵니다. 하지만 실제 서비스를 만들고 운영하다 보면, 문제는 단순히 “GPU가 부족하다”에서 끝나지 않습니다. GPU가 부족한 것도 맞지만, 동시에 이미 존재하는 GPU가 항상 잘 활용되고 있는 것도 아닙니다. 어떤 GPU는 요청이 몰려 과부하 상태이고, 어떤 GPU는 비어 있습니다. 평균 GPU utilization은

5월 29일

AI 모델 배포 비용을 낮추는 두 가지 기술: Quantization과 Prefix Caching

AI 모델 배포 비용을 낮추는 두 가지 기술: Quantization과 Prefix Caching

AI 모델 배포 비용을 낮추는 두 가지 기술: Quantization과 Prefix Caching

안녕하세요. AIEEV Dev Team의 김진범입니다. 저는 학부와 대학원에서 컴퓨터공학을 전공하고 AIEEV 창업 초기부터 함께하며 Air Cloud에 더 많은 분산 자원이 효율적으로 운영될 수 있도록 기여하고 있습니다 연구생 시절에는 AI 서비스의 성능 향상을 위한 이론적 연구와 실험을 많이 진행했습니다. 하지만 실제 서비스를 운영하다 보니, 좋은 모델과 높은 성능만으로는 충분하지 않다는 것을 알게 되었으며, 중요한 것은 AI 서비스를 사용자가 실제로 사용할 수 있을 만큼 빠르고, 비용 측면에서도 지속 가능하며, 안정적으로 제공할 수 있느냐였습니다. 저희 팀도 분산 GPU 환경에서 서비스를 운영하며 이 문제를 계속 마주해왔습니다. 더 큰 모델을 안정적으로 배포하고, 더 많은 요청을 처리하면서도 응답 지연시간을 일정하게 유지하려면 추론 단계의 최적화가 필요합니다. 모델 크기가 커질수록 GPU 메모리 사용량은 자연스럽게 증가합니다. 여기에 긴 시스

5월 7일

에어클라우드 4월 업데이트

에어클라우드 4월 업데이트

에어클라우드 4월 업데이트

AirCloud의 4월 릴리스는 AI 워크로드를 더 빠르게 실행하고, 더 안정적으로 운영하며, 보유 GPU 자원까지 유연하게 활용할 수 있도록 하는 데 초점을 맞췄습니다. 이번 업데이트에는 Air Container 운영 기능 강화, Air API 정식 GA, Resource Provider, RP 지원, 그리고 지능형 스케줄러 도입이 포함됩니다. 개발자는 컨테이너 접속과 로그 확인, 오류 대응, API 연동을 더 간단하게 처리할 수 있고, 기업·기관·GPU 보유 사업자는 보유 GPU 자원을 AirCloud 리소스 풀에 연결해 더 유연하게 활용할 수 있습니다. 1. Air Container 기능 보강 AI 워크로드를 운영할 때 가장 자주 필요한 작업은 컨테이너에 접속하고, 로그를 확인하고, 문제 상황을 빠르게 파악하는 것입니다. 이번 릴리스에서는 Air Container의 접속성, 운영 가시성, 제어 편의성을 전반적으로 개선했습니다. SSH 접속 지

4월 29일

명령어 하나로 끝내는 Air API 연동: ClawHub 플러그인 이야기

명령어 하나로 끝내는 Air API 연동: ClawHub 플러그인 이야기

명령어 하나로 끝내는 Air API 연동: ClawHub 플러그인 이야기

안녕하세요, 개발팀에서 DevOps/SRE를 담당하고 있는 이창윤입니다. 최근 Air API 출시와 함께 저희 팀은 인프라 모니터링 체계를 구축하고 있습니다. 이번 글에서는 그 과정에서 개발한 OpenClaw 플러그인을 소개하려고 합니다 🙂 시작하기 전에 OpenClaw를 한동안 써본 분이라면 한 번쯤 이런 상황을 겪어보셨을 겁니다. 외부 모델 프로바이더를 연결하려는 순간, 설정 메뉴를 뒤적이고 Base URL을 복사-붙여넣기 하고 사용할 모델마다 엔드포인트를 손으로 하나씩 등록하는 그 과정을요. 하다보면 동작은 하는데, 세팅이 유쾌하지는 않습니다. 이 글에서는 저희 팀이 개발한 플러그인을 통해 plugins install 명령어 하나가 이 모든 반복을 어떻게 없애는지를 소개해보도록 하겠습니다. 그리고 그 뒤에서는 실제로 무슨 코드가 돌아가는지까지도 함께 들여다보겠습니다. 기존 방식: Custom Provider, 모델마다 반복 아래 그림처럼

4월 16일

AIEEV 게시물 26개
AIRCLOUD 게시물 23개
AICOMPUTING 게시물 13개
에이아이브 게시물 10개
AIcloud 게시물 9개
클라우드비용비교 게시물 9개
GPUCLOUD 게시물 8개
AI 게시물 7개
Air API 게시물 6개
AIRCLOUD+ 게시물 6개
AITrend 게시물 6개
aieev 게시물 5개
AI인프라 게시물 5개
gpucloud 게시물 5개
Air Cloud 게시물 4개
distributedaicloud 게시물 4개
에어클라우드 게시물 4개
클라우드가격비교 게시물 3개
aircloud 게시물 2개
brand 게시물 2개
brandguide 게시물 2개
branding 게시물 2개
Business 게시물 2개
cloud 게시물 2개
CloudComputing 게시물 2개
container 게시물 2개
cxguide 게시물 2개
skt 게시물 2개
sktsummit 게시물 2개
tech 게시물 2개
분산형ai클라우드 게시물 2개
분산형GPU클라우드 게시물 2개
서비스기획 게시물 2개
프로모션 게시물 2개
agent 게시물 1개
AI Cost 게시물 1개
aiinference 게시물 1개
aisummit 게시물 1개
Automation 게시물 1개
AX플랫폼구축 게시물 1개
claude 게시물 1개
fix 게시물 1개
fix2025 게시물 1개
FundingAnnouncement 게시물 1개
gmep 게시물 1개
Google 게시물 1개
Jira 게시물 1개
lguplus 게시물 1개
Management 게시물 1개
microdips 게시물 1개
plugandplay 게시물 1개
prd 게시물 1개
PreA 게시물 1개
shift 게시물 1개
smartcity 게시물 1개
Updates 게시물 1개
경남매일 게시물 1개
디엑스웍스 게시물 1개
마이크로딥스 게시물 1개
박세진대표 게시물 1개
산업대상 게시물 1개
스타트업대상 게시물 1개
시프트 게시물 1개
에어클라우드정식출시 게시물 1개
엘지유플러스 게시물 1개
중기부글로벌엑셀러레이팅 게시물 1개
클라우드바우처 게시물 1개
플러그앤플레이 게시물 1개
할인 게시물 1개
확장가능한클라우드 게시물 1개

Copyright © 2026 AIEEV inc. All rights reserved.

All services are online

contact@aieev.com | sales@aieev.com

RESOURCES

자주 묻는 질문

시스템 상태

COMPANY

LEGAL

서비스 약관

개인정보보호 정책

연락하다

기술팀 문의

이메일*

뉴스레터를 구독하겠습니다.

가격
회사
문서
블로그

bottom of page