Bright Data CLI: evidência real da web, sempre

# uma página conhecida → markdown limpo (formato padrão) brightdata scrape "https://example.com/pricing" # escolha o formato explicitamente brightdata scrape "https://example.com/pricing" -f markdown

# uma página que bloqueia robôs — o Web Unlocker passa brightdata scrape "https://shop.example/item/42" \ --country us \ # geografia de saída -f markdown # um curl ingênuo aqui levaria um 403 ou uma página de CAPTCHA

function answer(question) { const hit = sh(`brightdata search "${question}" --json`); const page = sh(`brightdata scrape "${hit.topUrl}"`); return quote(page); // a linha exata ao vivo + sua fonte }

# 0 · descubra o catálogo ao vivo de tipos de dataset brightdata pipelines list # 1–4 · nomeie um dataset + um alvo → um registro limpo brightdata pipelines reddit_posts "https://reddit.com/r/…/comments/…" --pretty # grave muitos registros direto em um arquivo brightdata pipelines amazon_product_search "wireless earbuds" \ --format csv -o earbuds.csv

{ "title": "Anyone benchmarked the new CLI?", "author": "u/bench_nerd", "upvotes": 1284, "num_comments": 73, "created_utc": "2026-06-12T08:41:00Z", "subreddit": "r/commandline", "url": "https://reddit.com/r/…/abc", "flair": "Discussion" }

search

Você ainda não conhece a página. Rode uma consulta, receba links candidatos, depois vá buscar o melhor.

brightdata search "loop engineering CLI" \
  --json --pretty

Prós

+Acha fontes quando você não tem nenhuma.
+Barato, rápido, o primeiro passo natural.

Contras

–Retorna links, não o conteúdo da página.
–Geralmente precisa de uma raspagem em seguida.

Escolha quando Você precisa descobrir qual página guarda a resposta.

scrape

Você conhece a URL exata. Leia-a agora — passando por qualquer bot-wall — como markdown limpo.

brightdata scrape "https://site/pricing" \
  -f markdown

Prós

+Conteúdo real de qualquer página.
+Vence CAPTCHAs e 403s.

Contras

–Você já precisa conhecer a URL.
–Prosa, não campos nomeados.

Escolha quando Você tem a página e só precisa do que ela diz.

browser

O conteúdo só aparece depois que você clica, rola ou espera. Dirija uma sessão real passo a passo.

brightdata browser "https://app/feed" \
  --interactive --full-page

Prós

+Lida com fluxos de vários passos / logados.
+Captura a árvore da página ao vivo.

Contras

–O modo mais pesado e mais lento.
–Exagero para uma página estática.

Escolha quando Uma raspagem de um disparo não alcança — está atrás de interação.

pipelines

A fonte é uma plataforma conhecida. Receba campos nomeados e tipados em vez de sopa de página.

brightdata pipelines x_posts \
  "https://x.com/…/status/…" --pretty

Prós

+Campos limpos — sem parsing.
+Mais de 40 plataformas; amigável a massa.

Contras

–Apenas para plataformas suportadas.
–Inútil para uma página arbitrária.

Escolha quando É X / Reddit / YouTube / Amazon / LinkedIn / …

## NUNCA - WebSearch/WebFetch -> CLI brightdata # (NUNCA o MCP mcp__Bright_Data__*) ## Tools - Web search/scrape: SEMPRE o CLI brightdata (search / scrape / browser / pipelines) — NUNCA WebSearch/WebFetch, NUNCA o MCP mcp__Bright_Data__*

# a dúvida: 3.2 é mesmo a mais recente? → não chute, busque. # 1 · ache a fonte canônica (SERP) brightdata search "acme-lib releases" --json --pretty # → melhor resultado: a página de releases do pacote # 2 · leia-a passando por qualquer bot-wall (Web Unlocker) brightdata scrape "https://acme.dev/releases" -f markdown # → "Latest: 4.0.1 — released 2026-06-09" # 3 · cacheie o fato fundamentado em research.md, com sua fonte # acme-lib latest = 4.0.1 (acme.dev/releases, puxado em 2026-06-14) # a afirmação agora é evidência, não memória — e o loop cita 4.0.1, não 3.2.

Bright Data CLI: evidência real da web, sempre

A grande ideia

Por que um CLI, e por que este

A regra única

Os quatro modos da caixa de ferramentas

Aprofundamento de modo: scrape, de ponta a ponta

O que o scrape faz

Formatos de saída e assíncrono

O comando

Perguntas frequentes

Experimente: chutar, ou obter evidência real?

Agente que chuta

Agente de evidência

Chutando — sem busca, sem fonte

Fundamentado — buscar primeiro, depois citar

Alguns termos, em palavras simples

Onde ele se conecta ao loop

Anatomia de uma chamada de `pipelines`

O que acontece em uma chamada de pipelines

Por baixo do capô

Em uma imagem

No código

Acesse você mesmo

Dentro de um registro de dataset

Um relatório a partir de dados raspados & estruturados

Um modelo, duas visões

Por que um relatório, não saída crua

Escolhendo qual modo usar

search

scrape

browser

pipelines

No código

Acesse você mesmo

Exemplo resolvido: uma dúvida, fundamentada

Verificação rápida: o modelo aterrissou?

A grande ideia

Por que um CLI, e por que este

A regra única

Os quatro modos da caixa de ferramentas

Aprofundamento de modo: scrape, de ponta a ponta

O que o scrape faz

Formatos de saída e assíncrono

O comando

Perguntas frequentes

Experimente: chutar, ou obter evidência real?

Agente que chuta

Agente de evidência

Chutando — sem busca, sem fonte

Fundamentado — buscar primeiro, depois citar

Alguns termos, em palavras simples

Onde ele se conecta ao loop

Anatomia de uma chamada de pipelines

O que acontece em uma chamada de pipelines

Por baixo do capô

Em uma imagem

No código

Acesse você mesmo

Dentro de um registro de dataset

Um relatório a partir de dados raspados & estruturados

Um modelo, duas visões

Por que um relatório, não saída crua

Escolhendo qual modo usar

search

scrape

browser

pipelines

No código

Acesse você mesmo

Exemplo resolvido: uma dúvida, fundamentada

Verificação rápida: o modelo aterrissou?

Anatomia de uma chamada de `pipelines`