top of page

에어클라우드 4월 업데이트

  • 4월 29일
  • 3분 분량

AirCloud의 4월 릴리스는 AI 워크로드를 더 빠르게 실행하고, 더 안정적으로 운영하며, 보유 GPU 자원까지 유연하게 활용할 수 있도록 하는 데 초점을 맞췄습니다.


이번 업데이트에는 Air Container 운영 기능 강화, Air API 정식 GA, Resource Provider, RP 지원, 그리고 지능형 스케줄러 도입이 포함됩니다. 개발자는 컨테이너 접속과 로그 확인, 오류 대응, API 연동을 더 간단하게 처리할 수 있고, 기업·기관·GPU 보유 사업자는 보유 GPU 자원을 AirCloud 리소스 풀에 연결해 더 유연하게 활용할 수 있습니다.




1. Air Container 기능 보강


AI 워크로드를 운영할 때 가장 자주 필요한 작업은 컨테이너에 접속하고, 로그를 확인하고, 문제 상황을 빠르게 파악하는 것입니다. 이번 릴리스에서는 Air Container의 접속성, 운영 가시성, 제어 편의성을 전반적으로 개선했습니다.


SSH 접속 지원


AirCloud 콘솔에서 SSH 키 등록하는 화면
AirCloud 콘솔에서 SSH 키 등록하는 화면

Air Container에 접속하는 방식이 확장되었습니다. 이제 브라우저에서 바로 접근할 수 있는 Web 기반 SSH 접속과 기존 개발 환경에서 사용할 수 있는 SSH 터미널 직접 접속을 모두 지원합니다. 사용자는 상황에 따라 더 편한 방식으로 컨테이너에 접근하고 디버깅할 수 있습니다.



로그 히스토리 탐색성 개선


날짜, 시간, 키워드 등 필터를 고도화한 개선된 로그 화면
날짜, 시간, 키워드 등 필터를 고도화한 개선된 로그 화면

컨테이너 실행 이력과 로그 히스토리를 더 쉽게 확인할 수 있도록 목록 가시성을 개선했습니다. 과거 실행 로그를 탐색하고, 문제 발생 시 필요한 정보를 빠르게 찾을 수 있도록 운영 경험을 개선했습니다.



에러 알림 고도화


AirCloud 콘솔 알림 예시
AirCloud 콘솔 알림 예시

워크로드 실행 중 발생하는 오류를 더 명확하게 인지하고 대응할 수 있도록 에러 알림 흐름을 개선했습니다. 사용자는 장애 상황을 더 빠르게 확인하고, 필요한 후속 조치를 진행할 수 있습니다.



AirCloud Control CLI 제공

Docs의 Air Cloud CLI 사용하기 내용(일부)
Docs의 Air Cloud CLI 사용하기 내용(일부)

콘솔뿐 아니라 CLI 환경에서도 AirCloud 리소스를 제어할 수 있도록 AirCloud Control CLI를 제공합니다. 반복 작업 자동화, 운영 스크립트 구성, 개발자 워크플로우 통합이 더 쉬워집니다.




Shared Storage 기능 제공


다른 엔드포인트에 사용 중인 볼륨 공유 가능
다른 엔드포인트에 사용 중인 볼륨 공유 가능

여러 컨테이너와 워크로드에서 데이터를 더 유연하게 공유할 수 있도록 Shared Storage 기능을 제공합니다. 모델 파일, 데이터셋, 실행 결과물 등을 재사용해야 하는 AI 개발·운영 환경에서 활용도가 높습니다.



2. Air API 정식 GA 공개


Air API가 정식 GA로 공개되었습니다.


Qwen3.5-35b-a3b 코드 샘플
Qwen3.5-35b-a3b 코드 샘플

Air API는 OpenAI-compatible API를 기반으로 LLM과 TTS 기능을 제공합니다. 기존 OpenAI 호환 방식에 익숙한 개발자는 연동 흐름을 크게 바꾸지 않고도 Air API를 사용할 수 있으며, 성능·지연시간·비용 효율성·안정성의 균형을 갖춘 모델 API 환경을 구성할 수 있습니다.

이번 GA를 통해 개발자는 챗봇, AI 에이전트, 문서 요약, 코드 생성, 데이터 분석 보조, 음성 콘텐츠 생성 등 다양한 AI 기능을 Air API 기반으로 구현할 수 있습니다. AirCloud 콘솔에서 API 키를 발급받아 바로 연동을 시작할 수 있으며, LLM API와 TTS API를 하나의 Air API 환경에서 함께 사용할 수 있습니다.


💬 LLM API 제공 모델


🗣️ TTS API 제공 모델




3. AirCloud Resource Provider, RP 지원


AirCloud는 기업, 기관, GPU 보유 사업자가 보유한 GPU 자원을 AirCloud 리소스 풀에 연결할 수 있는 AirCloud Resource Provider, RP 기능을 지원합니다.


이번 업데이트를 통해 사내 GPU 서버, 연구·개발용 GPU 장비, 유휴 GPU 자원, GPU를 보유한 사업자의 인프라를 AirCloud의 워크로드 실행 자원으로 확장할 수 있습니다. 이를 통해 기존에 분산되어 있던 GPU 자원을 더 체계적으로 관리하고, 필요한 워크로드에 활용할 수 있는 기반을 제공합니다.


보유 GPU 자원의 AirCloud RP 연동



기업, 기관, GPU 보유 사업자는 보유한 GPU 자원을 AirCloud 리소스 풀에 연결할 수 있습니다. 연결된 자원은 AirCloud의 워크로드 실행 자원으로 활용될 수 있으며, 사용하지 않는 시간대의 유휴 자원까지 운영 자산으로 전환할 수 있습니다. PC방, 연구기관, 중소기업, 공공기관 등 GPU 인프라를 보유한 다양한 조직은 기존 인프라의 활용도를 높이고, 새로운 수익화 또는 자원 운영 모델을 구성할 수 있습니다.



통합 대시보드 및 모니터링


RP 대시보드 화면(일부)
RP 대시보드 화면(일부)

RP로 연결된 자원의 상태, 사용 현황, 운영 지표를 확인할 수 있는 통합 대시보드와 모니터링 기능을 제공합니다. 운영자는 연결된 GPU 자원의 상태를 더 쉽게 파악하고 관리할 수 있습니다.



사용량 기반 보상


일자별 리워드 현황(예시)
일자별 리워드 현황(예시)

Resource Provider가 제공한 GPU 자원이 AirCloud 워크로드 실행에 사용될 경우, 실제 사용량을 기준으로 보상이 제공됩니다. 이를 통해 GPU 보유 조직은 유휴 자원의 활용도를 높이는 동시에, 사용된 자원에 기반한 수익화 모델을 구성할 수 있습니다.




4. 지능형 스케줄러 도입


AirCloud에 지능형 스케줄러가 도입되었습니다. 새로운 스케줄링 엔진은 워크로드의 요구 사양과 실행 환경을 분석해, 더 적합한 디바이스를 자동으로 배정합니다.


최적 디바이스 자동 배정

워크로드의 요구 사양에 맞는 디바이스를 자동으로 판단하고 할당합니다. 사용자는 GPU 종류나 실행 환경을 매번 직접 비교하지 않아도, 워크로드에 적합한 실행 환경을 더 쉽게 확보할 수 있습니다.


콜드 스타트 시간 단축

컨테이너 이미지 레이어 캐시를 보유한 디바이스를 우선적으로 선택해 이미지 다운로드 시간을 줄입니다. 이를 통해 워크로드 시작 시간을 개선하고, 반복 실행이나 서비스 재시작 시 더 빠른 실행 경험을 제공합니다.





마무리


이번 4월 릴리스는 AirCloud를 더 빠르고 안정적인 AI 워크로드 실행 환경으로 발전시키기 위한 업데이트입니다. 개발자는 Air Container와 Air API를 통해 더 쉽게 빌드하고 배포할 수 있으며, 기업·기관·GPU 보유 사업자는 Resource Provider 기능을 통해 보유 GPU 자원을 AirCloud 리소스 풀에 연결하고 더 유연하게 활용할 수 있습니다. 또한 지능형 스케줄러는 워크로드에 적합한 디바이스를 자동으로 배정하고, 컨테이너 이미지 캐시를 활용해 콜드 스타트 시간을 줄임으로써 더 빠른 실행 경험을 제공합니다.


AirCloud 콘솔에서 최신 기능을 확인하고, Air API 키를 발급받아 바로 연동을 시작해보세요.


Blog
bottom of page