Google I/O 2026 핵심 정리: Managed Agents API부터 Gemini Omni까지

TL;DR

Google I/O 2026은 AI 에이전트 시대로의 전환을 공식 선언한 행사로, 100가지 이상의 발표 중 핵심은 Managed Agents API와 Gemini Omni다. 개발자는 이제 인프라를 직접 관리하지 않고 에이전트 동작만 정의하면 Google Cloud가 나머지를 처리하는 구조로 전환된다. 챗봇 시대의 종료와 에이전트 워크플로우 시대의 시작을 알리는 분기점이다.

배경: 챗봇에서 에이전트 워크플로우로

2026년 5월 19일, Google I/O 키노트는 단순한 신제품 발표회가 아니었다. Google이 공식적으로 천명한 메시지는 명확하다. “우리는 챗봇의 시대에서 AI 에이전트의 시대로 이동하고 있다.”

지난 수년간 LLM 기반 챗봇은 개발자 생산성 도구로 자리를 잡았다. 그러나 챗봇은 본질적으로 단발성 요청-응답 구조에 머문다. 반면 에이전트 워크플로우는 목표를 받아 스스로 계획을 수립하고, 도구를 호출하며, 중간 결과를 평가해 다음 단계를 결정하는 루프를 형성한다. Google I/O 2026의 100가지 이상의 발표는 이 패러다임 전환을 뒷받침하는 인프라와 모델을 동시에 제공하겠다는 선언으로 읽힌다.

국내 관점에서도 이 흐름은 무관하지 않다. 카카오, 네이버, 토스 등 대형 플랫폼 기업들이 내부 자동화 파이프라인을 고도화하는 과정에서 멀티 에이전트 오케스트레이션 아키텍처에 대한 수요는 이미 증가 추세에 있다. Google Cloud의 에이전트 인프라가 성숙해질수록, 이를 기반으로 한 B2B SaaS 혹은 내부 플랫폼 구축 비용이 낮아질 가능성이 있다.

핵심 메커니즘: Managed Agents API와 Antigravity

Managed Agents API — “기계가 아닌 임무를 관리하라”

이번 I/O에서 가장 주목할 만한 개발자 발표는 Gemini API에 출시되는 Managed Agents API다. 이 서비스의 설계 철학은 한 문장으로 요약된다. “manage the mission, not the machine.”

기존 에이전트 개발 방식은 개발자가 오케스트레이션 로직, 상태 관리, 재시도 정책, 도구 라우팅을 모두 직접 구현해야 했다. Managed Agents API는 이 복잡성을 Google Cloud 인프라 레이어로 흡수한다. 개발자는 에이전트의 동작(behavior) 만 정의하고, 실행 환경은 서비스 형태로 제공받는다. 사실상 agent-as-a-service 모델이다.

flowchart LR
    A[개발자: 에이전트 동작 정의] --> B[Managed Agents API]
    B --> C{Google Cloud 인프라}
    C --> D[도구 호출 관리]
    C --> E[상태 및 세션 메모리]
    C --> F[오케스트레이션 실행]
    D & E & F --> G[에이전트 응답 반환]

    style B fill:#4285F4,color:#fff
    style C fill:#34A853,color:#fff

위 다이어그램은 Managed Agents API의 개념적 흐름을 나타낸다. 실제 API 사양은 Google AI 공식 문서에서 확인해야 한다.

다만 중요한 제약이 있다. 명시적인 라우팅 결정이 필요하거나 복잡한 멀티 에이전트 오케스트레이션이 요구되는 경우, 로직을 별도 SDK(공식 발표된 ADK 계열)로 이식해야 하는 추가 개발 단계가 발생한다. 즉, Managed Agents API는 표준적인 에이전트 유즈케이스에 최적화되어 있으며, 고도로 커스터마이즈된 워크플로우에는 한계가 존재한다.

도구 호출 메커니즘

Managed Agents API에서 에이전트가 도구를 선택하고 실행하는 흐름은 아래와 같다.

도구 스키마 등록: 에이전트 정의 시 사용 가능한 도구 목록과 JSON Schema를 함께 전달한다.
모델 추론: Gemini 모델이 사용자 요청을 분석해 호출할 도구와 파라미터를 결정한다.
도구 호출 반환: 모델이 텍스트 응답 대신 function_call 객체를 반환한다.
실행 및 결과 피드백: 개발자 측 코드(또는 관리형 런타임)가 도구를 실행하고 결과를 function_response로 재전달한다.
최종 응답 생성: 모델이 도구 결과를 반영해 최종 응답을 생성한다.

// 도구 스키마 등록 예시
{
  "tools": [
    {
      "function_declarations": [
        {
          "name": "get_calendar_events",
          "description": "지정한 날짜의 Google Calendar 이벤트를 반환한다.",
          "parameters": {
            "type": "object",
            "properties": {
              "date": {
                "type": "string",
                "description": "조회 날짜 (YYYY-MM-DD 형식)"
              },
              "max_results": {
                "type": "integer",
                "description": "최대 반환 이벤트 수 (기본값: 10)"
              }
            },
            "required": ["date"]
          }
        }
      ]
    }
  ]
}

// 모델이 반환하는 function_call 예시
{
  "function_call": {
    "name": "get_calendar_events",
    "args": {
      "date": "2026-05-26",
      "max_results": 5
    }
  }
}

// 도구 실행 결과를 function_response로 피드백
{
  "function_response": {
    "name": "get_calendar_events",
    "response": {
      "events": [
        { "title": "주간 스프린트 리뷰", "time": "10:00" },
        { "title": "백엔드 온콜 인계", "time": "14:00" }
      ]
    }
  }
}

이 구조는 OpenAI의 tool use 패턴과 유사하지만, Managed Agents API에서는 도구 실행과 상태 관리를 Google Cloud 런타임이 대신 처리하는 옵션이 추가된다.

Google Antigravity — 개발자 플랫폼의 재정의

Google Antigravity는 개발자가 아이디어 수준의 작업에 집중하는 동안 에이전트가 반복적이고 복잡한 구현 작업을 처리하는 개발 플랫폼이다. 안드로이드 개발이 이 플랫폼에 통합되어 있다는 점이 특징적이다. 단순한 코드 생성 도구가 아니라, 앱 개발 전체 사이클에 에이전트를 내장하는 구조로 이해할 수 있다.

일부 외부 개발자는 이 플랫폼을 활용해 단시간 내에 완전히 작동하는 OS를 구축했다는 사례를 언급하고 있으나, 이는 공식 Google 발표 자료에서 직접 확인된 수치가 아니므로 독립적인 검증이 필요하다.

Managed Agents API 빠른 시작

주의: Managed Agents API는 I/O 2026에서 발표된 신규 서비스로, 아래 코드는 공개된 Gemini API 패턴과 Google ADK 문서를 기반으로 작성했다. GA 이전 사양이 변경될 수 있으므로 공식 문서에서 최신 API를 반드시 확인한다.

1. SDK 설치

# Gemini API SDK (Python 3.9+)
pip install google-generativeai

# Vertex AI 기반으로 사용하는 경우
pip install google-cloud-aiplatform

2. 에이전트 정의 코드 샘플

import google.generativeai as genai

genai.configure(api_key="YOUR_GEMINI_API_KEY")

# 도구 함수 정의
def get_weather(city: str) -> dict:
    """지정 도시의 현재 날씨를 반환한다."""
    # 실제 구현에서는 Weather API 호출
    return {"city": city, "temp_c": 22, "condition": "맑음"}

def search_web(query: str) -> dict:
    """웹 검색 결과 상위 3개를 반환한다."""
    # 실제 구현에서는 Search API 호출
    return {"results": [f"{query} 관련 결과 {i}" for i in range(1, 4)]}

# 에이전트 생성 — 도구 목록만 넘기면 오케스트레이션은 서비스가 처리
model = genai.GenerativeModel(
    model_name="gemini-2.5-pro",
    tools=[get_weather, search_web],
    system_instruction=(
        "당신은 업무 보조 에이전트입니다. "
        "사용자 요청에 따라 도구를 호출하고 결과를 요약합니다."
    ),
)

chat = model.start_chat(enable_automatic_function_calling=True)
response = chat.send_message("서울 날씨 알려줘")
print(response.text)

enable_automatic_function_calling=True 설정 시 도구 호출 루프(모델 추론 → 도구 실행 → 결과 피드백)를 SDK가 자동으로 처리한다.

3. REST API (curl) 예시

# 도구 포함 에이전트 요청
curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-pro:generateContent?key=${GEMINI_API_KEY}" \
  -H "Content-Type: application/json" \
  -d '{
    "system_instruction": {
      "parts": [{"text": "당신은 업무 보조 에이전트입니다."}]
    },
    "tools": [{
      "function_declarations": [{
        "name": "get_weather",
        "description": "지정 도시의 현재 날씨 반환",
        "parameters": {
          "type": "object",
          "properties": {
            "city": {"type": "string", "description": "도시명"}
          },
          "required": ["city"]
        }
      }]
    }],
    "contents": [{
      "role": "user",
      "parts": [{"text": "서울 날씨 알려줘"}]
    }]
  }'

응답에 functionCall 필드가 포함되면 해당 도구를 실행한 뒤 functionResponse로 재전송해 최종 응답을 받는 구조다. Managed Agents API의 관리형 런타임은 이 왕복 처리를 서버 측에서 대신 수행한다.

Gemini Omni: 멀티모달 생성의 확장

Gemini Omni는 모든 유형의 입력으로부터 모든 유형의 콘텐츠를 생성하는 것을 목표로 하는 멀티모달 모델이다. 현재는 영상(video) 생성 및 편집을 시작점으로 제공된다.

핵심 특징은 대화형 인터페이스다. 사용자는 단일 프롬프트로 영상 생성을 지시하는 것을 넘어, 시네마틱 줌 적용, 배경 변경 등 편집 작업을 자연어 대화 흐름 속에서 반복적으로 수행할 수 있다. Gemini 앱 내에서 이 기능이 제공된다.

에이전트 생태계와의 연결도 주목할 부분이다. Daily Brief는 Managed Agents API 기반의 즉시 사용 가능한(out-of-the-box) 에이전트로, 사용자의 목표에 기반해 하루 일정을 정리하고 우선순위를 지정하며 다음 단계를 제안한다. 이는 에이전트가 단순 코드 실행 도구를 넘어 개인 업무 조율자로 기능하는 방향을 보여준다.

헬스케어 영역에서는 웨어러블 디바이스를 Gemini 기반 소프트웨어의 진입점으로 활용하는 방향이 제시됐다. 다만 구체적인 제품명과 기능 범위는 공식 발표 자료(Google I/O 2026 세션)에서 직접 확인이 필요하다.

한계와 실무 고려사항

Managed Agents API의 추상화 수준은 장점이자 제약이다. 인프라 관리 부담을 줄이는 대신, 에이전트 실행 환경의 세부 제어권을 Google Cloud에 위임하는 구조다. 이는 특정 규제 환경(금융, 의료 등)에서 데이터 처리 위치나 감사 로그 접근성에 대한 요구사항과 충돌할 수 있다.

국내 금융권이나 공공 부문을 대상으로 서비스를 구축하는 팀이라면, Managed Agents API를 바로 프로덕션에 적용하기 전에 데이터 레지던시 정책과 SLA 조건을 공식 문서에서 반드시 확인해야 한다.

Gemini Omni의 생성 범위도 현재는 영상에 한정된다. “모든 입력에서 모든 것을 생성”이라는 목표는 향후 로드맵이며, 현재 기능과 미래 비전을 혼동하지 않는 것이 중요하다.

결론

Google I/O 2026의 기술적 핵심은 에이전트 워크플로우를 개발자가 실제로 사용할 수 있는 인프라 수준으로 끌어내린 것이다. Managed Agents API는 에이전트 개발의 진입 장벽을 낮추고, Antigravity는 개발 사이클 전체에 에이전트를 내장하는 방향을 제시한다. Gemini Omni는 멀티모달 생성의 범위를 영상으로 확장하며 대화형 편집 패러다임을 도입했다.

백엔드 및 ML 엔지니어 관점에서 당장의 실천 과제는 명확하다. Managed Agents API의 공식 문서와 Vertex AI 에이전트 관련 튜토리얼을 통해 실제 API 사양을 검토하고, 현재 운영 중인 LLM 파이프라인에서 에이전트화가 가능한 단위 작업을 식별하는 것이다.

출처

Google I/O ’26 Recap: Everything You Need to Know (YouTube): https://www.youtube.com/watch?v=tfx2CjqtCUI
Google AI 공식 개발자 문서: https://ai.google.dev/
Vertex AI 공식 문서: https://cloud.google.com/vertex-ai/docs