agents

[mcp tools] playwright tool에 관한 설명

jinmc 2026. 2. 11. 15:31
반응형

LLM 에이전트 시대에 다시 주목받는 브라우저 자동화 도구

최근 AI 에이전트, MCP, 자동화와 같은 키워드가 확산되면서 Playwright라는 이름도 자주 등장하고 있습니다.
이 때문에 “LLM 전용 라이브러리인가?”라고 오해하는 경우가 많은데, 결론부터 말씀드리면 Playwright는 LLM 라이브러리가 아니라 브라우저 자동화 도구입니다.

다만 AI 에이전트가 실제 웹 환경과 상호작용하기 위해 거의 필수적으로 사용되기 때문에 LLM 생태계에서 함께 언급되는 경우가 많습니다.


1. Playwright의 정체

Playwright는 마이크로소프트에서 개발한 웹 브라우저 자동 제어 라이브러리입니다.
코드를 통해 사람이 브라우저에서 수행하는 다양한 행동을 그대로 재현할 수 있습니다.

예를 들면 다음과 같습니다.

  • 웹사이트 접속
  • 버튼 클릭 및 입력 자동화
  • 로그인 처리
  • 스크롤 이동
  • 파일 다운로드
  • 스크린샷 촬영

즉, 사용자의 브라우저 행동을 코드로 자동화하는 도구라고 이해하시면 됩니다.

또한 지원 범위도 넓습니다.

  • Chromium, Firefox, WebKit 모두 지원
  • Node.js, Python, Java, .NET 환경 사용 가능

과거에는 Selenium이 널리 사용되었지만,
현재는 속도, 안정성, 개발 편의성 측면에서 Playwright로 이동하는 흐름이 뚜렷합니다.


2. 그런데 왜 LLM 분야에서 자주 등장할까?

핵심 이유는 단순합니다.

LLM은 대화를 생성할 수는 있지만, 직접 행동할 수는 없습니다.

그래서 AI 에이전트 구조에서는 항상 다음과 같은 흐름이 필요합니다.

LLM → Tool 호출 → 외부 환경에서 실제 행동 → 결과 반환

여기서 웹에서의 실제 행동을 담당하는 대표적인 도구가 바로 Playwright입니다.

대표적인 활용 예시는 다음과 같습니다.

  • 로그인해야 접근 가능한 페이지 데이터 수집
  • 검색 → 페이지 이동 → 정보 추출 자동화
  • 버튼 클릭 이후에만 나타나는 동적 데이터 확보
  • 화면 캡처 후 Vision 모델에 전달

이러한 작업은 단순 HTTP 요청 기반 크롤링으로는 불가능하며,
실제 브라우저 제어가 반드시 필요합니다.

따라서 다음과 같이 정리할 수 있습니다.

Playwright는 LLM의 ‘손과 눈’ 역할을 수행합니다.


3. MCP Tool 구조에서 중요한 이유

MCP(Model Context Protocol) 환경에서는
LLM이 외부 시스템을 직접 조작할 수 없고 반드시 Tool을 통해 행동해야 합니다.

이때 Playwright 기반 Tool을 연결하면 다음과 같은 작업이 가능해집니다.

  • “검색을 수행해 주세요”
  • “특정 사이트에 로그인해 주세요”
  • “버튼을 눌러 결과를 가져와 주세요”

즉, AI가 실제 웹을 조작하는 단계가 구현됩니다.

이 때문에 최근 에이전트 아키텍처에서는
Playwright가 기본 인프라 구성 요소처럼 사용되고 있습니다.


4. 언제 Playwright를 사용하면 좋을까?

다음과 같은 상황이라면 Playwright 사용이 적합합니다.

  • 로그인 기반 데이터 수집이 필요한 경우
  • React, Vue 등 동적 렌더링 페이지 크롤링
  • 사용자 행동 시뮬레이션 테스트 자동화
  • AI 에이전트의 웹 액션 실행

반대로 단순 정적 페이지 크롤링이라면
굳이 Playwright까지 사용할 필요는 없습니다.
이 경우에는 requestsBeautifulSoup 조합이 더 가볍고 효율적입니다.


5. 한 줄 정리

  • LLM 전용 라이브러리는 아님
  • 본질은 브라우저 자동화 도구
  • 그러나 AI 에이전트 시대에는 사실상 필수 인프라

그래서 최근 기술 문맥에서 더욱 자주 등장하고 있습니다.

 

🔗 Playwright 공식 레포

반응형