방법론Methodology
최종 업데이트Last updated: 2025-06-05 · v0.1 façade-strict
façade-strict 원칙 · Façade-strict commitment
Uhype가 표시하는 모든 숫자는 ToS가 허용하는 공개 소스에서 가져온 실제 값이거나, 데이터가 부족한 경우 null입니다. 플러그, 보간, 생성 AI 데이터는 없습니다.
Every number Uhype displays is either a real value from a ToS-permitted public source, or null when data is absent. No plugged values, no interpolated gaps, no AI-generated data.
1. 트렌드 점수Trend Score
트렌드 점수(0–100)는 세 가지 실제 신호의 합성입니다. 단일 소스에 의존하지 않아 한 플랫폼의 노이즈에 강합니다.
The Trend Score (0–100) is a composite of three real signals. No single source dominates, making it robust to platform-specific noise.
a. z-점수z-Score
최근 기간의 활동량을 이전 롤링 윈도우(기본 90일)의 평균·표준편차로 표준화합니다. 과거 대비 이상치 여부를 나타냅니다.
Activity in the most-recent period is standardised against the mean and standard deviation of a prior rolling window (default 90 days). This signals how anomalous the current level is versus recent history.
관측이 최소 요구 수에 미치지 못하면 zScore = null. / Fewer than the required minimum observations → zScore = null.
b. 모멘텀%Momentum %
직전 기간 대비 주간(또는 윈도우) 성장률입니다. 기저 볼륨이 최소 임계값(볼륨 플로어)에 미치지 못하면 momentumPct = null입니다. 분모가 0에 가까울 때 무의미한 수천 퍼센트를 표시하지 않기 위한 장치입니다.
Week-on-week (or window-on-window) growth rate of the primary aggregated signal. If the base-period volume is below a minimum floor, momentumPct = null — this prevents meaningless 10 000 % figures when the denominator is near-zero.
c. 다중 출처 폭Cross-Source Breadth
실제 데이터를 제공한 독립 소스(Wikimedia·GDELT·HN 등)의 수에 따라 점수에 가중치가 부여됩니다. 한 소스에서만 관측된 급등은 낮은 신뢰도를 받으며, 여러 독립 도메인에서 동시에 상승하는 용어는 더 높은 점수를 얻습니다.
The score is weighted by the number of independent sources (Wikimedia, GDELT, HN, etc.) that contributed real data. A spike seen in only one source gets lower confidence; a term rising simultaneously across independent domains earns a higher score.
합산Composition
세 신호는 정규화 후 가중 합산됩니다. 충분한 다중 소스 데이터가 없으면 score = null이 됩니다 — 0이 아닌 null이 정직한 신호입니다.
The three signals are normalised then combined with weights. When insufficient cross-source data exists to produce a reliable number, score = null — null, not zero, is the honest signal.
2. Breakout 레이블Label
"Breakout"은 퍼센트가 아니라 레이블입니다. 거의 0에 가까운 기저량에서 시작한 급격한 상승 패턴을 설명합니다. 이 레이블은 Google Trends의 "Breakout" 기준을 따르되, 자체 데이터 계산으로 적용됩니다.
"Breakout" is a label, not a fabricated percentage. It describes a sharp rise from a near-zero baseline — the same pattern Google Trends names "Breakout" — applied here to our own source data. It requires at least one low-base period and one high-activity period from real observations; never inferred from a single data point.
3. 데이터 소스Data Sources
점수 계산에 사용되는 소스("bake-OK")와 표시 전용 라이브 신호를 구분합니다.
We distinguish sources that are baked into the score ("bake-OK") from live-display-only signals that are shown in the browser but never stored.
| 소스Source | 데이터Data | 저장 여부Stored | 라이선스Licence |
|---|---|---|---|
| Wikimedia Pageviews ↗ 공식 API | 일별 아티클 조회수Daily article views | Yes ✓ | CC BY-SA 4.0 |
| GDELT DOC 2.0 ↗ DOC API | 글로벌 뉴스 기사 카운트Global news article counts | Yes ✓ | Public domain (Open Data) |
| Hacker News ↗ Algolia API | 스토리 점수·언급Story scores & mentions | Yes ✓ | 공개 APIPublic API |
| npm Downloads ↗ npmjs.org API | 패키지 일별 다운로드Package daily downloads | Yes ✓ | 공개 APIPublic API |
| PyPI Downloads ↗ pypistats.org | 패키지 일별 다운로드Package daily downloads | Yes ✓ | 공개 APIPublic API |
| Apple App Store Charts ↗ Apple RSS | 무료 앱 차트 순위Free-app chart ranks | Yes ✓ | 공개 RSSPublic RSS |
표시 전용 라이브 신호 (저장 안 됨)Live-Display-Only Signals (never stored)
Google 트렌드 / Naver DataLab — 이 두 신호는 브라우저에서 실시간으로 직접 가져와 표시됩니다. 이 데이터는 Uhype 서버에 저장되거나 재배포되지 않습니다. 각 서비스의 이용약관(Google ToS §4, Naver 데이터랩 이용약관)에 따른 조치입니다. 이들은 트렌드 점수 계산에 포함되지 않습니다.
Google Trends / Naver DataLab — these two signals are fetched live in your browser and shown directly. They are never stored on or redistributed from Uhype servers, in compliance with Google ToS §4 and Naver Datalab Terms of Service. They do not feed into the Trend Score calculation.
4. 크로스 도메인 지식 그래프Cross-Domain Knowledge Graph
Uhype의 핵심 차별점은 개별 신호가 아니라 트렌드 ↔ 뉴스 ↔ 시장 ↔ 논문 ↔ 자금 흐름을 하나의 지식 그래프로 연결하는 것입니다. 특정 용어를 클릭하면 사이트를 벗어나지 않고 해당 주제의 관련 시장 흐름, 뉴스 맥락, 학술 인용 네트워크로 이동할 수 있습니다.
Uhype's core differentiation is not any single signal but connecting trend ↔ news ↔ markets ↔ papers ↔ money-flow in one knowledge graph. Clicking a trend term stays inside Uhype and lands in the graph context for that topic — related market moves, news framing, and academic citation networks — rather than navigating away to an external page.
| 레이어Layer | 내용Content | 연결Connected to |
|---|---|---|
| 트렌드 / Trends | z-score 기반 검색어 급상승 | 뉴스, 시장, 논문 |
| 뉴스 / News | GDELT 글로벌 뉴스 기사 | 트렌드 용어, 기업/섹터 |
| 시장 / Markets | KOSPI·KOSDAQ·S&P 500 종목 네트워크 | 트렌드 용어, 뉴스 맥락 |
| 논문 / Papers | 학술 인용 네트워크 (계획 중 / planned) | 트렌드 용어, 기술 키워드 |
| 자금 흐름 / Money flow | 기관 지분 변동·공시 데이터 | 시장 종목, 트렌드 용어 |
5. 주의사항Caveats
- 점수는 이 데이터셋 내 상대적 순위이며, 절대적 인기도가 아닙니다.
Scores are relative within this dataset, not absolute measures of popularity. - 기저 볼륨이 최소 임계값 미만이면
momentumPct는null입니다.momentumPctisnullwhen base-period volume is below the minimum floor. - Google 트렌드·Naver DataLab은 표시 전용이며 점수에 포함되지 않습니다.
Google Trends and Naver DataLab are display-only and not stored in this dataset. - 예측(forecast) 필드는 과거 기록이 너무 짧거나 희박할 경우 비어 있습니다. 예측이 없는 것이 허구의 예측보다 낫습니다.
Forecast fields are absent when the real history is too short or sparse. A missing forecast is always preferable to a fabricated one. - ETL은 24시간마다 실행됩니다. 점수는 최대 24시간 지연될 수 있습니다.
The ETL runs daily. Scores may lag by up to 24 hours.
6. 문의Contact
방법론에 대한 질문 또는 오류 제보: support@uhype.app