📌 프로젝트 소개: JANBI란?

JANBI는 “잔업비서”의 줄임말로 마케터와 스타트업 팀이 경쟁사 웹페이지의 변화를 빠르게 파악할 수 있도록 돕는 자동화 도구입니다. 사용자가 지정한 웹페이지의 요소를 주기적으로 감시하고 변경이 감지되면 Slack으로 자동 알림을 전송해 반복적인 수작업 모니터링을 줄여주는 크롬 확장 프로그램입니다.

📖 목차

Motivation 🔥
Preview 📷
Architecture 🔧
Development 💻
Trouble Shooting 👾
Timeline 🗓

Motivation 🔥

"자주 들어가서 확인해야 하는 페이지, 누군가 대신 확인해주고 알려준다면 얼마나 편할까?”

개발 지식이 없는 사용자들도 “경쟁사의 가격이 바뀌었는지”, “새로운 상품이 등록되었는지” 같은 세부적인 내용을 매번 직접 확인하지 않고도 자동으로 알림을 받을 수 있도록 하는 것이 목표였습니다.
그래서 JANBI는 익스텐션 형태로 아래 기능을 제공합니다.

사용자가 페이지에서 모니터링하고 싶은 DOM 요소를 클릭으로 선택합니다.
요일과 시간을 선택하면 정해진 시간마다 해당 요소를 분석합니다.
선택한 요소가 변경되면 이를 감지합니다.
감지하면 Slack 알림으로 변경사항을 받아볼 수 있습니다.

번거롭고 비효율적인 일을 자동화 해 사용자를 대신해 일해주는 디지털 비서의 경험을 제공하고자 이 서비스를 만들게 되었습니다.

Preview 📷

🔍 STEP 1: 페이지에서 모니터링하고 싶은 요소를 클릭으로 선택합니다.

🔍 STEP 2: 모니터링할 페이지의 이름을 설정하고 알림 주기를 설정합니다.

🔍 STEP 3: 알림받을 슬랙의 워크스페이스를 연결합니다.

🔍 STEP 4: 대시보드에서 변경 내역을 확인할 수 있습니다.

🔍 STEP 5: 각 모니터링 요소의 상세 내역을 확인할 수 있습니다.

Architecture 🔧

페이지 구성과 기능별로 디렉토리를 분리했습니다.

JANBI 클라이언트는 React + Vite 기반의 대시보드 웹앱으로 FSD(Feature-Sliced Design) 패턴을 참고해 기능 단위로 코드를 분리했습니다. 각 폴더는 명확한 책임을 가지도록 설계하여 필요한 코드를 빠르게 찾고 수정하기 수월했습니다.

📦src
 ┣ 📂api                // 서버 통신을 담당하는 fetch 함수 모음
 ┣ 📂components         // 공통 UI, 대시보드, 히스토리 등 기능별 컴포넌트 정리
 ┣ 📂hooks              // 인증 상태, 변경 이력 등 커스텀 훅 정의
 ┣ 📂pages              // 라우팅에 대응되는 페이지 컴포넌트
 ┣ 📂utils              // 상수 및 유틸 함수 정리
 ┣ 📜App.jsx            // 전체 라우팅과 레이아웃 설정
 ┣ 📜main.jsx           // 앱 진입점
 ┗ 📜main.css           // Tailwind 기반 전역 스타일

기술 스택은 각 환경의 목적에 맞춰 선택했습니다.

클라이언트 (Web Dashboard)

기술 스택	설명
	URL 등록, 변경 이력 조회 등 인터랙션 중심의 UI를 컴포넌트 단위로 구성
	전역 상태 관리 라이브러리로 모달, 로그인 상태를 관리
	상태 기반 스타일 제어 및 반응형 UI를 빠르게 구성
	서버와의 데이터 연동 (URL 등록, 이력 조회 등)
	빠른 개발 서버와 번들링을 통해 SPA 환경에서 빠르게 화면 렌더링

Development 💻

1. 왜 익스텐션이어야 했을까?

초기에는 사용자가 입력한 URL을 팝업 창으로 띄우거나 iframe에 삽입해 DOM 요소를 선택하도록 하는 방식을 고민했습니다. 하지만 현실적인 브라우저 보안 정책과 기술적인 제약으로 인해 이 접근은 불가능했습니다.

1.1 팝업으로는 사용자 지정 웹사이트의 DOM에 접근할 수 없습니다.

팝업은 동일한 페이지를 띄워도 외부 창이기 때문에 현재 앱과 DOM을 공유할 수 없었습니다.
초기에는 사용자가 입력한 URL을 window.open() 으로 새 창으로 띄우고 그 안에서 요소를 선택하는 방식으로 구현을 고려했습니다. 하지만 이 접근은 기술적인 제약이 있었습니다.

1) 팝업은 별도의 브라우저 컨텍스트입니다.

팝업으로 열린 창은 부모 창과는 별개의 DOM 트리와 JavaScript 스코프를 갖습니다.
window.opener.document 처럼 접근을 시도하면 동일 출처 정책(Same-Origin Policy)에 따라 다음과 같은 보안 오류가 발생했습니다.

Same-Origin Policy는 스크립트가 접근하려는 리소스가 같은 출처일 때만 DOM 접근을 허용하는 보안 정책입니다.

Uncaught DOMException: Blocked a frame with origin "도메인"
from accessing a cross-origin frame.

팝업으로 열린 페이지의 DOM을 조작하거나 값 추출은 출처가 같을 때만 가능하며 외부 사이트는 JANBI의 출처와 다르기 때문에 DOM 접근 자체가 불가능했습니다.

Same-Origin Policy는 다음 중 하나라도 다르면 접근이 불가능합니다.

프로토콜 (http vs https)
도메인 (janbi.com vs other-example.com)
포트 (:3000 vs :443)

만약 팝업으로 열린 웹사이트가 https://www.naver.com 이라면 JANBI와 전혀 다른 출처를 가지므로 코드로 DOM에 접근할 수 없는 것이었습니다.

2) 팝업 내부에서 사용자 클릭을 감지하려면 JS 코드 삽입이 필요하지만 대부분 차단됩니다.

팝업 내부에서 사용자가 클릭한 요소를 감지하려면, 해당 페이지 안에 JS 코드를 주입해야 합니다.
이를 위해 window.postMessage()로 통신을 시도하거나 스크립트를 삽입해 클릭 이벤트를 감지하려 했지만 대부분의 외부 사이트는 Content Security Policy(CSP) 로 인해 스크립트 삽입을 차단합니다.
결과적으로 팝업 방식은 사용자 행동을 추적하거나 DOM 값을 전달받을 수 없다는 한계가 있었습니다.

1.2 iframe 또한 브라우저 보안 정책으로 인해 대부분의 타 사이트 페이지를 삽입할 수 없습니다.

처음에는 외부 웹사이트를 iframe으로 JANBI 페이지에 삽입한 뒤 그 안에서 DOM 요소를 직접 클릭하거나 추적하는 방식도 고려했습니다. 하지만 iframe 방식은 브라우저 보안 정책에 의해 Naver, Google, Instagram 등과 같은 주요 웹사이트에서 차단되며 DOM 접근 또한 불가능하다는 문제점이 있었습니다.

1) iframe 삽입 자체가 차단됩니다.

많은 웹 사이트는 보안을 위해 자신의 페이지가 다른 웹사이트의 iframe 안에서 열리지 않도록 설정하고 있었습니다. 이 때 대표적으로 사용되는 HTTP 응답 헤더는 다음 두가지였습니다.

X-Frame-Options: DENY 또는 SAMEORIGIN

아예 iframe 삽입을 막거나 같은 origin 에서만 iframe 삽입을 허용합니다.
Content-Security-Policy: frame-ancestors 'none'

어떤 출처에서도 해당 페이지를 iframe으로 삽입하는 것을 허용하지 않습니다.

예를 들어 https://www.naver.com 은 iframe 삽입이 시도되면 브라우저 콘솔에 다음과 같은 오류가 발생하며 페이지가 불러와지지 않았습니다.

Refused to display 'https://www.naver.com/' in a frame because it set 'X-Frame-Options' to 'sameorigin'.

우리 서비스가 외부 웹 사이트를 iframe에 넣는 시도 자체가 근본적으로 차단되는 것이었습니다.

2) 만약 iframe 삽입이 되더라도 DOM 접근은 불가능합니다.

iframe 삽입을 허용한 사이트가 있더라도 팝업에서 DOM 접근에 불가능했던 것과 같이 동일 출처 정책에 걸려 다음과 같은 보안 오류가 발생했습니다.

Uncaught DOMException: Blocked a frame with origin "도메인" from accessing a cross-origin frame.

iframe으로 사용자가 지정한 웹사이트를 불러와도 해당 페이지의 DOM에 접근해 요소를 추적하거나 클릭 이벤트를 감지하는 것은 불가능했습니다.

1.3 그래서 Chrome 익스텐션을 선택했습니다.

위의 두 방식 모두 브라우저 보안 정책에 막혀 사용자가 지정한 웹사이트의 DOM을 분석하거나 조작하는 기능을 구현할 수 없었습니다.
반면, Chrome 익스텐션은 Content Script를 통해 외부 웹사이트에 직접 주입되어 DOM에 접근할 수 있으며, UI 삽입, 요소 추적, 이벤트 리스닝 등이 가능했습니다.
JANBI는 이 구조를 기반으로 사용자가 마우스로 클릭한 요소를 추적하고 스케줄에 따라 이를 분석하며 변경된 경우 Slack 알림을 보내는 전체 흐름을 구현할 수 있었습니다.

2. DOM 요소를 선택할 때 어떤 선택자 방식이 적합할까?

JANBI는 사용자가 웹페이지에서 클릭한 요소를 추적하는 구조이기 때문에 "해당 요소를 가장 안정적으로 다시 찾을 수 있는 선택자"를 생성하는 것이 핵심이었습니다. 처음엔 CSS Selector만을 사용했지만 실제 웹페이지 구조의 다양성과 한계를 마주하며 XPath와의 혼합 방식으로 발전하게 되었습니다.

2.1 CSS Selector와 XPath란?

웹 페이지의 DOM 요소를 가리키는 방식은 대표적으로 두 가지가 있습니다.

CSS Selector

HTML의 id, class, 태그, 구조 등을 기반으로 요소를 선택합니다.

예시
div.content > ul > li:nth-child(2)

XPath

DOM 트리의 경로 기반으로 요소를 탐색하는 방식입니다.

예시
/html/body/div[2]/ul/li[2] //*[@id="price"]

2.2 CSS Selector는 직관적이지만 한계가 있습니다.

초기에는 .class, #id 같은 CSS Selector 기반으로 요소를 선택했습니다.
이는 직관적이고 대부분의 요소를 쉽게 선택할 수 있었습니다. 하지만 아래와 같은 경우에서는 CSS Selector만으로는 정확한 요소를 잡기 어려웠습니다.

id/class가 없는 구조적 요소
요소가 반복 구조 안에 있을 경우
DOM 구조가 자주 바뀌는 경우

예시: ul > li:nth-child(2)
A/B 테스트로 li 순서가 바뀌면 다른 요소가 선택되는 문제가 발생할 수 있습니다.

이러한 이유로, 동적인 구조에서는 CSS Selector만으로는 요소를 안정적으로 추적하기 어려운 경우가 많았습니다.

2.3 XPath 또한 구조 기반 접근이 가능하지만 한계가 있습니다.

그래서 XPath로 방식을 수정했습니다.
XPath는 DOM 구조 기반 접근이 가능해 다음과 같은 장점이 있었습니다.

동적 class 이름 없이도 위치 기반 접근이 가능하다.
중첩된 구조에서도 정확한 경로 표현이 가능하다.
반복적인 구조 안에서도 유일한 위치를 표현 가능하다.

예시
//ul/li[3]/span (리스트 중 3번째 항목)

하지만 XPath도 제약이 있었습니다.

일부 웹 사이트는 Shadow DOM을 사용하고 있었고 이 내부에 있는 요소들은 일반적인 XPath 방식으로는 탐색이 되지 않았습니다.

📌 Shadow DOM이란?
Shadow DOM은 웹 컴포넌트의 일부로, 캡슐화된 별도의 DOM 트리입니다. 외부 스크립트나 XPath 같은 일반적인 DOM 탐색 방식으로는 내부 요소를 접근할 수 없습니다.

이로 인해 XPath만으로는 모든 요소를 안정적으로 추적할 수 없었고, 구조에 따라 다른 방식이 필요했습니다.

2.4 XPath와 CSS Selector 혼합 방식을 선택했습니다.

JANBI는 다음과 같은 방식으로 선택자 타입을 결정하도록 했습니다.

Shadow DOM 안의 요소 일 때는 CSS Selector 방식을 사용합니다.
일반 DOM 요소는 XPath 방식을 사용합니다.

if (isShadowDom) {
  return { type: "css", selector: getCssSelector(targetElement) };
} else {
  return { type: "xpath", selector: getXPath(targetElement) };
}

이처럼 실제 DOM 구조에 따라 동적으로 적절한 선택자 방식을 판단하고 요소를 추적할 수 있도록 구현했습니다.

3. 선택된 요소의 텍스트, 이미지 변화를 어떻게 감지할까?

JANBI는 사용자가 시각적으로 인지할 수 있는 실질적인 콘텐츠 변화만 감지합니다.
단순한 HTML 구조나 속성 변화가 아닌 텍스트 또는 이미지의 실제 값이 바뀌었는지를 기준으로 삼습니다.

3.1 사용자가 선택한 요소는 서버에 저장됩니다.

사용자가 Chrome 확장 프로그램에서 클릭한 요소는 다음 정보를 포함해 서버로 전송됩니다.

type: css 또는 xpath
selector: 실제 선택자 문자열
content: 선택 당시의 텍스트 혹은 이미지 주소

서버는 이 정보를 기준값으로 저장하며 추후 감지 주기에 따라 이 값과 최신 값을 비교하게 됩니다.

3.2 변화 감지는 텍스트와 이미지 주소를 기준으로 합니다.

요소의 어떤 속성이 바뀌었는지를 판별하기 위해 아래와 같이 조건을 분리했습니다.

텍스트는 .textContent() 를 통해 공백을 제거한 순수 텍스트를 추출합니다.
이미지는 .getAttribute("src") 를 통해 실제 보여지는 이미지 경로를 비교합니다.

3.3 비교 결과는 변경 여부와 함께 이력에 저장됩니다.

추출된 값은 이전 값과 비교됩니다.

변경됨: beforeHtml과 afterHtml이 다를 때
변경 없음: 두 값이 동일할 때

이 정보는 DB의 ChangeLog에 기록되며 Slack 알림에도 사용됩니다.

3.4 시각적으로 의미 있는 변화만 감지해 불필요한 알림을 줄입니다.

JANBI는 UI 상의 실제 변화만 주목합니다. HTML 구조의 미세한 변경이나 class 속성의 추가/삭제처럼 사용자에게 시각적으로 보이지 않는 변화는 감지 대상이 아닙니다.

변경 예시	변경 감지 여부
"오늘 마감" → "내일 마감"	✅ 감지됨
`src="/banner1.png"` → `src="/banner2.png"`	✅ 감지됨
`<div class="new updated">` → `<div class="new latest">`	❌ 감지되지 않음
HTML 내부 순서 변경, 스타일 변경 등 눈에 띄지 않는 기술적 변경	❌ 감지되지 않음

즉, 단순히 DOM이 바뀌었는지가 아닌 사용자가 보기에 달라졌는가? 를 기준으로 추적합니다.
이 기준은 시각적 영향이 없는 변경은 무시하므로 불필요한 알림을 최소화하고 사용자에게 실제 영향을 주는 내용만을 전달합니다.

4. Slack은 어떻게 연동할까?

JANBI는 사용자가 선택한 요소의 변경사항을 지정된 시간에 자동으로 분석하고 그 결과를 Slack 채널로 알려주는 기능을 제공합니다. 이 Slack 연동은 익스텐션과 서버가 역할을 나누어 함께 작동합니다.

4.1 실시간 팀 알림에 적합한 수단인 Slack을 선택했습니다.

Slack은 스타트업 환경에서 이메일보다 더 빠르고 협업에 최적화된 커뮤니케이션 도구입니다. 이러한 특성을 고려해 Slack을 주요 알림 수단으로 선택했습니다.

많은 스타트업 팀은 실시간 소통과 빠른 피드백을 위해 Slack을 메신저처럼 사용하고 있습니다. JANBI도 웹 페이지 변경사항을 팀 전체에 빠르게 공유하고 즉각적인 대응을 가능하게 하는 것을 목표로 합니다.

이메일은 주로 개인 단위 전달에 적합하고 확인까지 시간이 걸리는 반면, Slack은 메시지 형태로 알림을 실시간 전송받고 팀 채널에 공유할 수 있어 반응 속도가 훨씬 빠릅니다.

특히 JANBI는 경쟁사 페이지 모니터링, 가격 변경 감지 등 빠른 의사결정이 중요한 스타트업 팀을 주요 타겟으로 하고 있기 때문에 Slack이 가장 적합하다고 생각했습니다.

4.2 Slack 인증은 익스텐션 팝업으로 진행합니다.

사용자가 웹페이지에서 DOM 요소를 선택하고 이름과 알림 스케줄(요일/시간)을 설정하면 해당 정보가 서버로 전송됩니다.
서버는 요소 데이터를 저장하고 응답으로 URL에 대한 고유 식별자(id)를 반환합니다.
익스텐션은 이 urlId를 포함한 Slack 인증 URL을 생성하고 새 창으로 인증 팝업을 띄웁니다.

const slackAuthUrl = `https://slack.com/oauth/v2/authorize?client_id=${SLACK_CLIENT_ID}&scope=chat:write,incoming-webhook&redirect_uri=${encodeURIComponent(REDIRECT_URI)}&state=${urlId}`;

window.open(slackAuthUrl, "_blank", "width=600,height=800");

URL의 고유 식별자(id)는 인증 완료 후 서버에서 어떤 URL에 Slack 채널을 연결할 지 식별하는 데 사용됩니다.

4.3 인증이 완료되면 서버가 Slack 채널 정보를 저장합니다.

사용자가 Slack 인증을 완료하면 Slack은 인증 결과를 redirect_uri로 전달합니다. 이때 두 가지 주요 값이 함께 포함됩니다.

code: Slack이 인증을 마친 후 보내주는 일회용 비밀번호 같은 값입니다. 서버는 이 code를 가지고 Slack에 다시 요청해서 실제로 메시지를 보낼 수 있는 권한(access token)을 받게 됩니다.
state: 인증을 요청할 때 함께 보내는 이 인증이 어떤 작업을 위한 건지 기억해두는 표시입니다. 예를 들어, 사용자가 모니터링하려는 URL을 등록하면 그 설정에는 고유한 ID(urlId)가 생기고 이 값을 state에 담아 보냅니다. Slack 인증이 완료된 후 서버는 이 state 값을 보고 어떤 URL 설정에 Slack 채널을 연결해야 할지 알 수 있습니다.

요청이 성공하면 Slack은 다음과 같은 정보를 응답으로 보내줍니다.

access_token: Slack API를 호출할 수 있는 토큰
channel_id, channel_name: 알림을 보낼 채널 정보
webhook_url: 해당 채널로 메시지를 보낼 수 있는 Webhook 주소

서버는 응답받은 정보를 기반으로 해당 URL에 Slack 정보를 저장합니다.

await Url.findByIdAndUpdate(state, {
  slack: {
    token: access_token,
    channelId: incoming_webhook.channel_id,
    channelName: incoming_webhook.channel,
    webhookUrl: incoming_webhook.url,
  },
});

4.4 Slack 메시지는 before/after 형식으로 발송됩니다.

알림은 변경 여부에 따라 다음과 같이 다르게 구성했습니다.

🔔 변경이 감지된 경우: 최대 3개의 변경 내용을 before/after로 요약
📌 변경이 없을 경우: "변경 사항 없음" 안내 메시지 전송

5. 정해진 시간에 어떻게 알림을 보낼까?

JANBI는 사용자가 설정한 요일과 시간에 맞춰 경쟁사 웹 페이지를 자동으로 분석하고 변경사항이 있는 경우 Slack으로 알림을 보냅니다.
이 기능은 node-cron 라이브러리를 통해 구현되어 있습니다.

📌 node-cron이란?
일반적인 크론 표현식(예: 매주 월요일 오전 9시)에 따라 특정 작업을 주기적으로 실행할 수 있도록 도와주는 Node.js 기반의 스케줄러입니다.

5.1 node-cron으로 반복 작업 스케줄을 관리합니다.

간단한 문법: "30 9 * * 1"처럼 직관적인 표현식으로 실행 시점을 지정할 수 있습니다.
추가 설치 필요 없음: OS 수준 크론 설정 없이 Node.js 안에서 실행가능합니다.
정기 작업에 특화: "매일 오전 9시", "매주 금요일 오후 6시" 같은 반복 작업에 최적화되어있습니다.

JANBI처럼 정해진 시간마다 반복적으로 스크래핑 작업을 실행해야 하는 서비스에서는 node-cron이 좋은 선택이라고 생각했습니다.

5.2 스케줄은 사용자 등록 시점에 동적으로 생성됩니다.

사용자가 익스텐션에서 URL, 요일, 시간, 추적 요소를 등록합니다.
서버는 해당 정보를 바탕으로 크론 스케줄을 생성하고 node-cron.schedule()로 등록합니다.
등록된 시간에 자동으로 페이지를 스크래핑하고 요소가 바뀌었는지 감지합니다.
변화가 감지되면 Slack으로 알림을 보냅니다.

cron.schedule("0 10 * * 1", () => {
  // 매주 월요일 오전 10시에 실행
  detectChanges(...);
});

JANBI에서는 요일, 시간 값을 기준으로 동적으로 크론 표현식을 생성해 스케줄을 등록합니다.

6. 향후에는 Redis와 메시지 큐로 구조를 개선할 계획입니다.

현재 JANBI는 스케줄링 전용 서버에서 node-cron을 사용해 사용자가 설정한 시간에 맞춰 작업을 자동으로 실행하고 있습니다.
스케줄링 서버는 예약된 시간마다 스크래핑 서버를 호출하고 지정된 웹페이지의 요소를 분석해 변경 여부를 판단합니다.

이 구조는 단순하고 반복적인 작업에는 안정적으로 동작하지만 서비스가 확장되면 다음과 같은 문제가 발생합니다.

서버 재시작 시 스케줄 초기화 이를 보완하기 위해 서버 부팅 시 DB에서 스케줄을 다시 불러오는 initializeSchedule()을 구현했습니다.
수평 확장 어려움 서버를 여러 대로 늘릴 경우 중복 실행이 발생할 수 있습니다.
복잡한 일정 처리 불가 공휴일 제외, 10분 간격 반복 등 유연한 일정 처리는 어렵습니다.
장기적으로 예약 작업의 수가 많아지면 스케줄 관리 어려움

이런 문제를 해결하기 위해 Redis + 메시지 큐 기반 구조로 전환을 고려하고 있습니다.

6.1 구조 전환 시 작업 흐름은 이렇게 바뀝니다.

사용자가 URL, 알림 시간, Slack 채널을 등록하면 API 서버는 이 정보를 Redis에 저장합니다.
동시에 메시지 큐(Bull 등)에 작업이 등록되고 지정된 시간에 실행될 준비를 합니다.
등록된 시간이 되면 큐가 작업을 실행하고 스크래핑 서버를 통해 실제 DOM 요소를 분석하여 변경 여부를 감지합니다.
사용자의 Slack으로 알림을 전송합니다.

이 방식은 서버가 여러 대일 경우에도 중복 없이 안정적으로 실행되며 공휴일 제외, 특정 요일 반복, 10분 단위 실행 등 복잡한 스케줄 조건도 유연하게 처리할 수 있습니다.

6.2 수평 확장성과 유연한 스케줄링 두 가지를 모두 해결합니다.

서버가 여러 대여도 안정적인 실행 => 여러 인스턴스가 실행되더라도 동일 작업이 중복 실행되지 않아 확장성에 유리합니다.
복잡한 조건도 유연하게 대응 가능 => 공휴일 제외, 특정 요일 반복, 10분 단위 실행 등 다양한 스케줄을 지원할 수 있습니다.

현재는 node-cron 기반 스케줄링 서버만으로도 충분히 안정적으로 작동하고 있지만 서비스가 커질수록 구조적 유연성과 안정성을 위해 메시지 큐 기반의 아키텍처로 전환이 필요하다고 판단했습니다.

Trouble Shooting 👾

1. CSR 페이지에서 요소 감지에 실패해 Playwright로 전환했습니다.

CSR(Client-Side Rendering) 기반 웹사이트는 JavaScript가 실행된 후에야 실제 DOM 요소들이 만들어지기 때문에 초기 HTML에는 원하는 데이터가 포함되어 있지 않습니다.
이로 인해 정적 HTML만 처리하는 도구인 Cheerio로는 애초에 해당 요소를 탐색할 수 없는 구조적 한계가 있었습니다.

1.1 Cheerio는 렌더링되지 않은 HTML만 처리할 수 있습니다.

Cheerio는 서버에서 받은 HTML을 정적으로 파싱하는 도구입니다. 하지만 CSR 페이지는 JavaScript가 실행된 이후에야 필요한 데이터와 요소가 동적으로 생성되기 때문에 Cheerio는 다음과 같은 한계를 가집니다.

HTML 구조는 있지만 실제 텍스트나 이미지 데이터가 없음
JavaScript가 만든 요소는 HTML 소스에 포함되지 않음
사용자가 보는 정보와 서버가 받은 HTML이 다름

HTML에는 사용자에게 보이는 핵심 정보가 포함되지 않기 때문에 애초에 비교 대상이 되는 콘텐츠를 추출할 수 없어 변경 감지 자체가 불가능했습니다.

1.2 Cheerio와 Playwright를 혼합해서 사용해보았습니다.

처음에는 페이지 성격에 따라 다르게 처리해보려 했습니다.

정적 페이지는 Cheerio로 빠르게 처리
CSR 페이지는 Playwright로 렌더링 후 감지

Cheerio는 속도가 빠르고 의존성이 적다는 장점이 있었기 때문에 정적 페이지는 빠르게 처리해서 결과를 보여줘야하지 않을까 생각한 것입니다.

하지만 JANBI는 사용자가 브라우저에서 실시간으로 결과를 확인하는 서비스가 아닌, 스케줄에 따라 주기적으로 스크래핑하고 Slack으로 알림만 보내는 구조이기 때문에 렌더링 방식과 무관하게 모든 페이지에서 일관된 결과를 확보하는 것이 더 중요했습니다.
따라서 모든 페이지를 Playwright 기반으로 통일했습니다.

1.3 DOM이 다 만들어지기 전에 탐색을 시작하면 실패합니다.

Playwright를 사용하면 CSR 페이지의 실제 렌더링된 DOM에 접근할 수 있습니다.
하지만 JavaScript 실행이 완료되기 전이나 요소가 나타나기 전에 탐색을 시도하면 타이밍 문제로 인해 요소를 찾을 수 없었습니다.

CSR 방식은 JavaScript가 실행된 후에야 실제 화면이 구성됩니다.
Playwright는 페이지 로딩 직후부터 코드를 실행할 수 있는데 이 시점에는 요소들이 DOM에 나타나지 않은 상태일 수 있는 것입니다.

예를 들어, Playwright에서 다음과 같은 요소를 찾을 때

const title = await page.locator("#price").textContent();

요소가 아직 로드되지 않았다면 null이 반환되거나 에러가 발생합니다.

1.4 페이지 전체가 로딩되고 요소가 나올 때까지 기다려야 합니다.

이러한 타이밍 문제를 해결하기 위해 Playwright에서는 렌더링 완료까지 기다리는 기능들을 활용할 수 있었습니다.

1) 페이지 전체 렌더링이 완료될 때까지 기다리기

await page.goto(url, { waitUntil: "networkidle" });

Playwright의 page.goto() 에서 waitUntil: "networkidle" 을 사용하면 네트워크 요청이 일정 시간 이상 없을 때까지 기다린 뒤 다음 코드가 실행됩니다. 이 설정은 CSR 페이지에서 리소스 로딩 및 JavaScript 초기 실행이 안정적으로 끝난 시점을 기준으로 이후 탐색 로직을 실행하게 해줍니다.

2) 특정 요소가 실제로 등장할 때까지 기다리기

const locator = page.locator(selector);
await locator.waitFor({ state: "attached", timeout: 10000 });

locator.waitFor() 메서드는 해당 요소가 DOM에 생성될 때까지 기다리는 기능입니다. 요소가 최대 10초 이내에 DOM에 나타나면 탐지에 성공하고 그렇지 않으면 타임아웃 에러가 발생합니다.

3) 실제로 보이는 상태인지 확인하기

DOM에 생성된 요소가 실제로 사용자에게 보여지는지 확인합니다.

if (await locator.isVisible()) {
  const tag = await locator.evaluate(el => el.tagName);
}

isVisible()은 요소가 실제로 화면에 보이는지를 확인해주며 display: none, opacity: 0, visibility: hidden 등으로 가려진 요소를 제외한 실제 사용자에게 노출된 요소만 감지할 수 있습니다.

1.5 CSR 페이지에서도 요소 탐지가 안정적으로 동작하게 되었습니다.

기존에는 CSR 웹 페이지에서 요소 탐지가 자주 실패했고 그에 따라 잘못된 변경 알림이나 알림 누락이 발생할 수 있었습니다.
하지만 렌더링을 대기하는 메서드, 요소 등장까지 대기하는 메서드, 화면에 보이는지 확인하는 메서드를 함께 활용해 페이지 전체 로딩 -> 요소 등장 -> 시각적 확인이라는 안정적인 탐색 흐름을 구현할 수 있었습니다.

이로써 CSR 페이지에서도 안정적으로 요소를 탐색하고 변경 여부를 정확하게 판단할 수 있게 되었습니다.

2. 사용자 지정 웹사이트에서 URL 저장이 되지 않았습니다.

JANBI는 사용자가 방문 중인 웹페이지 위에서 특정 요소를 클릭하면 그 정보를 서버에 저장해 추후 변경을 감지합니다.
하지만 이 기능이 동작하지 않는 문제가 있었고 원인은 CORS(Cross-Origin Resource Sharing) 정책 때문이었습니다.

📌 CORS(Cross-Origin Resource Sharing)란?
웹 브라우저가 보안을 위해 서로 다른 출처(origin) 간의 요청을 제한하는 정책입니다.
서버가 Access-Control-Allow-Origin에 명시적으로 해당 출처를 허용하지 않으면 요청은 실패합니다.

2.1 크롬 익스텐션의 Content Script는 페이지의 origin을 따라갑니다.

Chrome 익스텐션에서 DOM 요소를 추적하려면 Content Script가 필요합니다.
Content Script는 웹페이지 위에서 실행되기 때문에 요청의 출처(Origin)는 사용자가 보고 있는 웹사이트 주소와 동일하게 됩니다. 즉, 서버 입장에서는 웹사이트 자체가 JANBI 서버에 직접 요청하는 것처럼 보이는 상황이 됩니다.

CORS 정책상 서버가 명시적으로 허용한 origin이 아닌 경우 브라우저는 요청을 차단합니다.

Access to fetch at 'https://janbi-server-production.up.railway.app/urls' from origin '외부 도메인' has been blocked by CORS policy.

2.2 서버에서 CORS를 조건부 허용해보았습니다.

처음에는 이 요청이 크롬 익스텐션에서 오는 요청이라고 생각했습니다.
익스텐션은 일반적으로 chrome-extension:// 이라는 출처(origin)를 갖기 때문에 서버에서 이 익스텐션 주소를 포함한 몇 가지 안전한 출처만 허용하도록 CORS 설정을 작성했습니다.

app.use(cors({
  origin: (origin, callback) => {
    if (!origin || allowedOrigins.includes(origin)) {
      callback(null, true);
    } else {
      callback(new Error("CORS 에러: 허용되지 않은 origin입니다."));
    }
  },
  credentials: true,
}));

하지만 이 설정은 동작하지 않았습니다.
왜냐하면 실제로 요청을 보낸 것은 익스텐션 자체가 아니라 웹페이지에 주입된 Content Script였기 때문입니다.

즉, 요청의 출처가 chrome-extension://이 아니라 사용자가 열어본 웹사이트 주소였고 이 웹사이트는 CORS 허용 목록에 없었기 때문에 요청이 계속 차단되었던 것이었습니다.

2.3 background script를 통해 요청을 보내야 했습니다.

해결 방법은 Content Script에서 직접 요청을 보내는 것이 아니라 background script를 통해 요청을 중계하는 방식이었습니다.

Content Script는 웹 사이트의 출처를 따라가서 보안 제약을 받습니다.

반면 background script에서 fetch() 요청을 수행하면 이 요청의 origin은 익스텐션의 출처(chrome-extension://...)가 되므로 서버에서 CORS 허용 대상에 이미 포함된 안전한 출처가 됩니다.

구분	Content Script	Background Script
실행 위치	실제 웹사이트 위에서 실행됨	Chrome 익스텐션 내부에서 따로 실행됨
요청 출처 (Origin)	웹사이트 주소 (예: naver.com)	익스텐션 주소 (`chrome-extension://`)
CORS 허용 여부	❌ 대부분 차단됨	✅ 서버에서 허용되므로 문제 없음
용도	웹 페이지 DOM 조작, 요소 추적, UI 표시 등	서버 통신, 토큰 저장, 인증 처리 등 백그라운드 작업

1) Content Script에서 background로 메시지를 전송합니다.

사용자가 요소를 선택하면 Content Script는 메시지를 보내고 실제 네트워크 요청은 하지 않습니다.

2) background에서 서버로 요청을 전송합니다.

서버는 안전한 익스텐션 출처에서 요청이 왔다고 인식하게 되어 정상적으로 요청을 수락합니다.

2.4 URL 저장 기능이 모든 페이지에서 정상 동작하게 되었습니다.

background script로 요청을 중계하는 구조로 바꾸면서 모든 웹사이트에서 안정적으로 URL 등록이 가능해졌습니다.

이로 인해 사용자는 어떤 사이트에서도 DOM 요소를 선택하고 알림을 받을 수 있게 되었고 브라우저 보안 정책(CORS)을 우회하면서도 안정적으로 동작하게 되었습니다.

3. 특수문자 ID/class로 인해 요소 탐색이 실패했습니다.

ID나 class 속성에 특수문자가 포함된 경우 CSS 선택자가 깨져 요소 탐지가 실패하는 문제가 있었습니다.
JANBI는 사용자가 클릭한 DOM 요소의 CSS Selector 또는 XPath를 저장하고, 이후 Playwright를 통해 해당 요소를 다시 찾습니다. 하지만 공백, 숫자 시작, #, : 같은 특수문자가 있는 경우 querySelector() 및 Playwright의 locator()가 오류를 발생시켜 정상 탐지가 되지 않았습니다.

3.1 CSS 선택자에서 특수문자는 이스케이프 처리가 필요합니다.

CSS 선택자는 HTML 내 ID나 class를 기반으로 요소를 선택할 수 있습니다.
하지만 다음과 같은 경우에는 CSS 문법 규칙에 맞지 않기 때문에 선택자 파싱 자체가 실패합니다.

<div id="price#main"></div>
<div class="123-item name with space"></div>

다음과 같이 작성하면 오류가 발생합니다.

document.querySelector("#price#main");        // ❌
document.querySelector(".123-item");          // ❌
document.querySelector(".name with space");   // ❌

이런경우 querySelector는 SyntaxError: Failed to execute 'querySelector' 오류를 던지며 Playwright에서도 마찬가지로 locator 생성이 실패하게 됩니다.

3.2 `CSS.escape()`를 사용해 선택자를 이스케이프 처리했습니다.

📌 CSS.escape() 란?
CSS.escape()는 특수문자가 포함된 문자열을 CSS 선택자에서 안전하게 사용할 수 있도록 이스케이프 처리해주는 브라우저 내장 함수입니다.
HTML ID나 class 속성 값에 공백, 숫자 시작, #, ., : 등의 특수문자가 포함되었을 때, 이를 그대로 CSS 선택자에서 사용하면 문법 오류가 발생할 수 있습니다. 이때 CSS.escape()를 사용하면 이러한 특수문자를 자동으로 이스케이프 처리하여 querySelector, document.querySelectorAll, page.locator 등에서 안전하게 사용할 수 있도록 도와줍니다.

const unsafeId = "price#main";
const safeSelector = `#${CSS.escape(unsafeId)}`;
const element = document.querySelector(safeSelector);

Playwright에서도 마찬가지로 적용할 수 있습니다.

const escapedSelector = `#${CSS.escape(idValue)}`;
const locator = page.locator(escapedSelector);

CSS.escape()를 이용하면 특수문자가 포함되어 있어도 안전하게 DOM 요소를 선택할 수 있었습니다.

3.3 선택자 생성 단계에서 자동 이스케이프 처리하도록 구현했습니다.

JANBI에서는 사용자가 클릭한 요소의 ID나 class를 기반으로 CSS 선택자를 자동 생성하는 과정에서 다음과 같은 조건이 감지되면 CSS.escape()로 감싸도록 처리했습니다.

function getCssSelector(targetElement) {
  const id = targetElement.id;
  if (id) return `#${CSS.escape(id)}`;

  const classes = [...targetElement.classList];
  if (classes.length > 0) return '.' + classes.map(CSS.escape).join('.');

  return targetElement.tagName.toLowerCase();
}

3.4 특수문자가 포함된 요소도 안정적으로 추적할 수 있게 되었습니다.

기존에는 "123-item"이나 "name with space"와 같이 특수문자가 있는 요소를 선택하려 할 때 예외가 발생하거나 탐지가 실패했습니다.
하지만 CSS.escape()를 적용하면서 모든 특수문자 케이스에 대해 안전하고 일관된 선택이 가능해졌고 JANBI의 요소 추적 기능이 보다 정확해졌습니다.

4. 일부 페이지에서 요소 선택 UI가 깨지거나 보이지 않았습니다.

JANBI는 웹사이트 위에 직접 UI를 띄워 사용자가 모니터링할 DOM 요소를 클릭으로 선택할 수 있도록 합니다.
그런데 일부 웹사이트에서는 이 UI가 제대로 보이지 않거나 아예 깨져서 작동하지 않는 문제가 있었습니다.

4.1 외부 웹 사이트의 스타일이 UI에 영향을 주었습니다.

익스텐션은 웹 페이지 안에서 실행되는 content.js를 통해 직접 UI를 추가합니다.
그런데 이렇게 삽입한 UI는 원래 그 웹사이트가 가진 CSS 스타일의 영향을 그대로 받습니다.

웹 사이트 쪽의 CSS가 더 우선순위가 높아서 JANBI의 스타일이 무시되었습니다.
Tailwind 스타일이 웹 사이트의 Reset CSS와 충돌했습니다.
스타일 충돌로 버튼이 사라지거나 레이아웃이 깨졌습니다.

UI가 일부 웹 사이트에서 깨져 보이는 문제는 대부분 외부 스타일 충돌 때문이었습니다. 이 문제를 해결하기 위해 Shadow DOM을 활용하기로 했습니다.

4.2 Shadow DOM을 사용해 UI를 캡슐화시켰습니다.

📌 Shadow DOM이란?
Shadow DOM은 기존 DOM과 분리된 독립적인 DOM 공간을 만들어주는 기술입니다. 이렇게 만든 영역은 바깥쪽 CSS나 스크립트의 영향을 받지 않기 때문에 UI를 완전히 캡슐화할 수 있습니다.

이 문제를 해결하기 위해 UI 전체를 Shadow DOM 안에 렌더링하는 방식으로 전환했습니다.

1) 스타일도 Shadow DOM 내부에 삽입했습니다.

처음엔 Tailwind 클래스만 사용했지만 사용자가 지정한 웹사이트의 CSS에 덮여버리는 경우가 많아 Shadow DOM 내부에 <style> 태그를 직접 삽입해서 스타일을 보호했습니다.

const style = document.createElement("style");
style.textContent = `
  #janbi-selector-panel { ... }
  .janbi-title { ... }
`;

shadowRoot.appendChild(style);

2) 유저가 선택할 때 UI 스타일은 원래 페이지에 스타일을 삽입했습니다.

사용자가 클릭한 실제 웹 페이지의 요소는 Shadow DOM 밖에 있는 요소들이기 때문에 이 부분은 기존처럼 document.head에 스타일을 추가해서 처리했습니다.

const style = document.createElement("style");
style.textContent = `
  .janbi-hover {
    outline: 2px dashed #2536D2 !important;
    cursor: crosshair !important;
  }

  .janbi-selected {
    outline: 2px solid rgba(61, 61, 60, 0.35) !important;
    background-color: rgba(255, 250, 200, 0.55) !important;
  }
`;

document.head.appendChild(style);

사용자가 선택한 요소에 테두리나 배경 표시가 정상적으로 잘 보이게 되었습니다.

4.3 모든 사이트에서 UI가 안정적으로 작동합니다.

기존에는 버튼이 사라지거나 보이지 않는 문제가 있었지만 Shadow DOM을 통해 UI 전체를 캡슐화한 이후로는 어떤 웹사이트에서도 안정적으로 작동하게 되었습니다.

User Experience 👥

1. 변경 이력 페이지에 페이지네이션을 도입했습니다.

처음에는 한 번에 모든 변경 이력을 불러와서 화면에 모두 보여주었습니다.

하지만 시간이 지나면서 이력이 점점 누적되었고 다음과 같은 불편함이 생겼습니다.

스크롤이 너무 길어져서 원하는 내용을 찾기 어렵고 보기 불편했습니다.
화면에 표시할 내용이 많아져 처음 들어갈 때 로딩이 느려졌습니다.
변경 이력을 구간 별로 빠르게 확인하기 어려웠습니다.

이 문제를 해결하기 위해 10개씩 나눠서 볼 수 있는 페이지네이션 기능을 추가했습니다.

적용 전	적용 후

2. 같은 내용의 이력은 한 번만 저장되도록 개선했습니다.

JANBI는 일정한 시간마다 웹 페이지의 요소를 확인합니다. 예전에는 내용이 바뀌지 않아도 계속해서 똑같은 이력이 누적됐습니다.

이제는 이전 기록과 내용이 완전히 동일하면 저장하지 않도록 개선했습니다.

중복 로그가 줄어들어 데이터가 훨씬 깔끔하게 관리되었습니다.
사용자는 반복되는 내용을 계속 확인할 필요가 없어졌습니다.
사용자가 알고 싶은 중요한 변경기록만 눈에 잘 띄게 되었습니다.

적용 전	적용 후

3. 비개발자도 쉽게 사용할 수 있도록 요소 선택 UI를 개선했습니다.

처음에는 개발자에게 익숙한 XPath나 CSS Selector가 그대로 노출되었고 선택 방식도 직관적이지 않아 비개발자에게는 진입장벽이 있었습니다.

이제는 기술적인 내용을 감추고 시각적으로 명확하고 직관적인 인터페이스로 개선했습니다.

3.1 선택 가능한 상태를 시각적으로 안내했습니다.

마우스를 움직일 때 커서가 십자 모양(+)으로 바뀌고 마우스 위에 있는 요소에는 점선 테두리를 표시하여 지금 어떤 요소를 선택할 수 있는지 쉽게 인지할 수 있도록 구현했습니다.

3.2 선택 완료된 요소는 눈에 띄게 강조했습니다.

선택이 완료되면 해당 요소에 연한 배경색과 실선 테두리가 적용되어 "어떤 요소를 선택했는지" 명확하게 보이도록 구현했습니다.

다시 페이지를 둘러보더라도 어떤 부분이 선택된 상태인지 한눈에 파악할 수 있습니다.

3.3 사용자에게는 복잡한 선택자 대신 직관적인 콘텐츠 정보만 노출했습니다.

선택한 요소의 기술적인 경로(XPath, CSS Selector)는 내부적으로 처리되고 사용자에게는 다음과 같이 실제 화면에 표시되는 콘텐츠만 보여줍니다.

선택자	사용자에게 보여지는 정보
❌ `//*[@id="product-price"]`	⭕️ `"₩24,900"`
❌ `div > ul > li:nth-child(3)`	⭕️ `"신제품 출시"`
❌ `#main-banner > img`	⭕️ `"https://example.com/banner.png"`

사용자가 개발 지식 없이도 "내가 지금 어떤 요소를 선택했는지" 명확하게 이해할 수 있도록 했습니다.

적용 전	적용 후

Name		Name	Last commit message	Last commit date
Latest commit History 111 Commits
.github		.github
.husky		.husky
assets		assets
public		public
src		src
.gitignore		.gitignore
.prettierignore		.prettierignore
README.md		README.md
eslint.config.js		eslint.config.js
index.html		index.html
package-lock.json		package-lock.json
package.json		package.json
postcss.config.js		postcss.config.js
prettierrc.json		prettierrc.json
tailwind.config.js		tailwind.config.js
vite.config.js		vite.config.js

jan-bi/janbi-client

Folders and files

Latest commit

History

Repository files navigation