검색 봇
검색 봇이란?
검색 봇은 스파이더라고도 하며, 일반적으로 검색 인덱스를 구축할 목적으로 인터넷을 지속적으로 탐색하는 로봇입니다.
봇은 트래픽 수치를 인위적으로 부풀릴 수 있으므로 그 존재를 인식하는 것이 중요합니다.
클릭 사기에 사용되는 다른 유형의 봇도 있습니다. 클릭 사기 및 예방 방법에 대해 자세히 알아보세요.
검색 봇과 Linkly
Linkly는 의도적으로 자신을 드러내는 검색 봇과 스파이더를 감지할 수 있습니다. 트래픽 리포트의 봇 섹션에서 봇으로 분류된 클릭을 확인할 수 있습니다.
봇 트래픽 및 봇 차단 방법에 대한 문서가 있습니다.
소셜 미디어 크롤러의 특별 처리
Linkly는 Facebook, YouTube, Google, LinkedIn, X의 소셜 미디어 크롤러를 개선된 방식으로 처리합니다.
이러한 크롤러의 트래픽이 링크에 도달하면:
- 분석에 기록되지 않습니다
- 클릭 한도에 계산되지 않습니다
- 크롤러는 올바른 대상으로 투명하게 리디렉션됩니다
- "로봇 차단" 기능이 활성화된 경우에도 이러한 크롤러는 항상 허용됩니다
이를 통해 소셜 미디어 크롤러가 클릭 한도를 소비하는 것을 방지하면서도 미리보기를 생성하고 링크를 확인할 수 있습니다.

링크를 따라가는 봇 차단
Linkly는 로봇과 검색 스파이더가 링크를 따라가는 것을 차단할 수 있습니다. 봇 차단 활성화에 대한 지침은 봇 트래픽을 참조하세요.
중요: Facebook, YouTube, Google, LinkedIn, X의 소셜 미디어 크롤러는 차단이 활성화된 경우에도 항상 허용되므로 링크 미리보기가 계속 작동합니다.
봇이 클릭 한도에 계산되나요?
Facebook, YouTube, Google, LinkedIn, X의 소셜 미디어 크롤러는 클릭 한도에 계산되지 않으며 분석에 기록되지 않습니다.
아래에 식별된 다른 모든 봇은 출처에 관계없이 트래픽을 모니터링하고 리디렉션하는 데 동일한 비용이 들기 때문에 클릭 한도에 계산됩니다.
차단된 봇(차단 페이지를 만난 봇)도 한도에 계산되지 않습니다.
검색 봇 목록
다음은 Linkly가 식별하고 필요한 경우 차단할 수 있는 검색 봇과 해당 사용자 에이전트 목록입니다.
- 200pleasebot 200PleaseBot
- 360spider 360Spider
- abot CrawlDaddy, abot
- addthis AddThis
- adldxbot Microsoft Bing Ads
- admantx ADmantX Platform Semantic Analyzer
- adsbot-google Google Adwords
- advbot AdvBot
- ahrefsbot Ahrefs backlinks research tool
- alexa Alexa Crawler
- apache-httpclient Java http library
- apachebench ApacheBench (ab)
- apis-google APIs-Google
- appengine-google Google App Engine
- applebot Apple Bot
- archive.org_bot Internet Archive (archive.org)
- ask jeeves Ask Jeeves
- asynchttpclient Java http and WebSocket client library
- awe.sm Awe.sm URL expander
- baidu Baidu
- bdcbot Big Data Corp
- bingbot Microsoft Bing
- bingpreview Microsoft Bing preview
- bitlybot bit.ly bot
- blekkobot Blekkobot
- blexbot BLEXBot (webmeup)
- bot@linkfluence.net Linkfluence bot
- bufferbot BufferBot
- buibui-checkbot buibui
- butterfly Topsy Labs
- buzztalk buzztalk
- catchbot CatchBot (catchbot.com)
- check_http Nagios monitor
- cliqzbot Cliqzbot
- cmradar/0.1 CMRadar/0.1
- coldfusion ColdFusion http library
- commoncrawl CCBot
- comodo-webinspector-crawler Comodo
- crowsnest Crowsnest
- curabot cura.yt
- curl curl unix CLI http client
- dap/nethttp DAP/NetHTTP
- datagnionbot datagnion.com/bot.html
- daumoa Korean portal and search engine indexing bot
- developers.google.com/+/web/snippet/ Google Plus
- diffbot Diffbot
- digitalpersona fingerprint software HP Fingerprint scanner
- domain re-animator bot Domain Re-Animator Bot
- domainsbot DomainsBot
- domaintunocrawler DomainTuno
- dotbot Dot Bot
- duckduck Duck Duck Go
- elb-healthchecker AWS ELB HealthChecker
- embedly Embedly
- eoaagent EOAAgent
- eventmachine httpclient Ruby http library
- everyonesocialbot EveryoneSocial
- evrinid Evri bot
- exabot Exalead's bot
- exaleadcloudview ExaleadCloudView
- facebookexternalhit Facebook Bot
- facebot Facebook Bot
- feedburner RSS bot
- feedfetcher-google Google Feedfetcher
- findxbot Findxbot
- flipboardproxy FlipboardProxy
- friendfeedbot FriendFeed
- genieo Genieo Web filter bot
- getprismatic.com getprismatic.com
- gigabot Gigabot spider
- gimme60bot Gimme60 (gimme60.com)
- gimmeusabot Gimme60 (gimme60.com)
- go http package Go http library
- google page speed insights Google Page Speed Insights
- google Web Preview Google Instant Previews crawler
- google-structured-data-testing-tool Google-StructuredDataTestingTool
- google-structureddatatestingtool Google-StructuredDataTestingTool
- googlebot Google Bot
- googlestackdrivermonitoring-uptimechecks GoogleStackdriverMonitoring-UptimeChecks
- grapeshotcrawler GrapeshotCrawler
- gravitybot Gravity Bot
- hatena::bookmark Hatena::Bookmark
- heritrix heritrix
- htmlparser HTMLParser
- http_request2 HTTP_Request2
- httpclient HTTPClient
- https://developers.google.com/+/web/snippet Google+ Snippet Fetcher
- hubspot HubSpot
- ia_archiver Internet Archive (WayBackMachine)
- icoreservice iCoreService
- idmarch idmarch.org/bot.html
- inagist URL resolver
- insieve Insieve Bot
- insitesbot Insitesbot
- instapaper Instapaper
- istellabot IstellaBot
- jack jack
- jakarta commons Jakarta Commons HttpClient
- java Generic Java http library
- jetslide Jetslide
- js-kit URL resolver
- kemvibot Kemvi
- kimengi Kimengi Bot
- knows.is knows.is
- kojitsubot Kojitsubot
- komodiabot KomodiaBot
- kraken kraken
- laconica Laconica
- libwww-perl Perl client-server library
- lijit crawler Lijit
- linkdexbot Linkdex Bot
- linkedinbot LinkedIn
- linkscrawler LinksCrawler
- linode Linode Longview
- lipperhey Lipperhey
- livelapbot Livelapbot
- loadtimebot Load Time Bot
- longurl URL expander service
- ltx71 ltx71.com
- lumibot Lumibot
- lwp-trivial Another Perl library
- magpie-crawler magpie-crawler
- mail.ru_bot Mail.ru Bot
- meanpathbot meanpath
- mediapartners-google Google Adsense bot
- megaindex.ru MegaIndex
- memorybot mignify.com/bot.html
- metauri MetaURI
- mfe_expand Mcafee spider
- mir web crawler MIR web crawler
- mj12bot Majestic-12 spider
- mojeekbot Mojeek UK search crawler
- mrchrome MrChrome
- ms search 6.0 robot MS Search 6.0 Robot
- msnbot-media Microsoft media bot
- msnbot Microsoft bot
- nerdybot NerdyBot
- netcraft Netcraft
- netstate netEstate NE Crawler
- netvibes Personalized dashboard bot
- netzcheckbot netzcheck
- newrelicmonitor NewRelic monitor
- newrelicpinger NewRelicPinger
- newsme newsme
- niki-bot niki-bot
- ning NING - Yet Another Twitter Swarmer
- nutch Apache search spider
- openhosebot OpenHoseBot
- orangebot OrangeBot
- pagesinventory pagesinventory.com
- panopta Monitoring service
- paperlibot PaperLi
- peerindex peerindex
- percolatecrawler PercolateCrawler
- perfectmarketkwtbot PerfectMarket
- phantomjs PhantomJS
- pingdom Pingdom monitoring
- pinterest Pinterest
- plukkie botje.com/plukkie.htm
- privacyawarebot PrivacyAwareBot
- proximic Proximic Spider
- psbot-page Picsearch
- publiclibraryarchive.org publiclibraryarchive.org
- pycurl Python http library
- python-httplib2 Python-httplib2
- python-requests Python http library
- python-urllib Python http library
- queryseeker QuerySeekerSpider
- quicklook QuickLook
- re-animator Domain Re-Animator Bot
- readability Readability
- rebelmouse RebelMouse
- redditbot Reddit Bot
- relateiq RelateIQ
- riddler Riddler Bot
- rogerbot SeoMoz spider
- rssmicro RSS/Atom Feed Robot (rssmicro.com)
- ruby Ruby
- scrapy Scrapy
- screaming frog seo spider Screaming Frog SEO Spider
- searchmetricsbot SearchmetricsBot
- semrushbot SEO analysis bot
- seokicks SEOKicks
- seznambot SeznamBot
- shopwiki ShopWiki
- shortlinktranslate Link shortener
- showyoubot Showyou iOS app spider
- siege Joe Dog Siege
- sistrix SISTRIX
- siteuptime Site monitoring services
- slack Slackbot-LinkExpanding
- slackbot Slack Bot
- slurp Yahoo spider
- smtbot SimilarTech
- socialrank SocialRankIOBot
- sogou Chinese search engine
- spbot OpenLinkProfiler
- spider generic web spider
- spinn3r Spinn3r aggregator
- sputnikbot SputnikBot
- squider Squider
- statuscake StatusCake
- stripe Stripe
- test certificate info C http library?
- tineye TinEye Bot
- traackr Traackr Bot
- trendictionbot Trendiction Search
- turnitinbot TurnitinBot
- tweetedtimes The Tweeted Times
- tweetmemebot TweetMeMe Crawler
- twikle Social web search bot
- twitjobsearch TwitJobSearch
- twitmunin Twitmunin
- twitterbot Twitter URL expander
- twurly Twurly
- typhoeus Typhoeus
- umbot uberMetrics
- unwindfetch Gnip
- uptimerobot Uptime Robot
- vagabondo Vagabondo
- vb project Visual Basic
- vigil Vigil
- vkshare VKontake Sharer
- voilabot VoilaBot
- vrcrawler Venture Radar
- wasalive-bot Wasalive Bots
- watchsumo WatchSumo
- wbsearchbot Ware Bay Best Buys
- webscout Webscout
- wesee WeSEE
- wget wget unix CLI http client
- wordpress WordPress spider
- wormly WormlyBot
- wotbox Wotbox
- xenu link sleuth Xenu Link Sleuth
- xing-contenttabreceiver Xing bot
- xovibot XoviBot
- yacybot YaCy
- yahoo-ad-monitoring Yahoo Ad monitoring
- yandex Yandex
- yeti Naver Corp
- yourls YOURLS
- zelist.ro feed parser
- zibb ZIBB spider
- zitebot Zite
- zyborg Zyborg
봇으로 식별된 클라우드 제공업체
많은 봇이 스스로를 봇으로 식별하지 않지만, 우리는 인터넷 서비스 제공업체를 추적하고 주요 클라우드 제공업체의 트래픽도 봇일 가능성이 높은 것으로 식별합니다.
- Google Cloud
- Microsoft Corporation
- OVH SAS
- DigitalOcean
- Huawei Clouds
- Google-private-cloud
- Amazon.com
- Google Proxy
- Omonia d.o.o.
- ColoCrossing
검색 봇 FAQ
Linkly는 봇을 어떻게 감지하나요?
Linkly는 사용자 에이전트 문자열(많은 봇이 스스로를 알림)을 통해 봇을 식별하고 트래픽이 알려진 클라우드 호스팅 제공업체 또는 데이터 센터에서 발생했는지 확인합니다.
이 목록에 없는 봇이 있나요?
봇 감지를 정기적으로 업데이트합니다. 이 목록에 없는 봇의 트래픽이 보이면 저희에게 연락해 주시면 추가하겠습니다.
실제 사용자인데 일부 클릭이 봇으로 표시되는 이유는 무엇인가요?
VPN 또는 기업 네트워크를 사용하는 사용자는 트래픽이 데이터 센터를 통해 라우팅되기 때문에 봇으로 플래그가 지정될 수 있습니다. 자세한 내용은 VPN 트래픽에 대한 문서를 참조하세요.
어떤 특정 봇이 내 링크를 방문했는지 확인할 수 있나요?
예. 트래픽 리포트에서 봇 탭을 클릭하면 사용자 에이전트별 봇 트래픽 분석을 확인할 수 있습니다.