検索ボット

検索ボットとは

検索ボット(スパイダーとも呼ばれる)は、通常、検索インデックスを構築するため、継続的にインターネットをブラウジングするロボットです。

ボットはトラフィック数を人為的に増やす可能性があるため、その存在を認識することが重要です。

検索ボットとLinkly

Linklyは、自らを明らかにする検索ボットとスパイダーを検出できます。トラフィックレポートのボットセクションで、どのクリックがボットに起因するかを確認できます。

ボットトラフィックとボットをブロックする方法に関する記事があります。それはこちらです。

ソーシャルメディアクローラーの特別な処理

Linklyは、Facebook、YouTube、Google、LinkedIn、Xからのソーシャルメディアクローラーに対して改善されたハンドリングを行っています。

これらのクローラーからのトラフィックがあなたのリンクにアクセスした場合:

  • 記録されません(分析内)
  • クリック制限にカウントされません
  • クローラーは透過的にリダイレクトされて正しい宛先へ向かいます
  • 「ロボットをブロック」機能が有効な場合でも、これらのクローラーは常に許可されます

これにより、ソーシャルメディアクローラーがあなたのクリック制限を消費することを防ぎながら、プレビュー生成とリンクチェックを許可し続けられます。

Linklyトラフィックレポートのボットトラフィック
Linklyトラフィックレポートのボットトラフィック

ボットがリンクをたどることをブロック

Linklyはロボットと検索スパイダーがあなたのリンクをたどることをブロックできます。ボットブロックを有効にする方法については、ボットトラフィックを参照してください。

重要:****Facebook、YouTube、Google、LinkedIn、Xからのソーシャルメディアクローラーは、ブロックが有効な場合でも常に許可されるため、リンクプレビューが機能し続けます。

ボットはクリック制限にカウントされますか?

Facebook、YouTube、Google、LinkedIn、Xからのソーシャルメディアクローラーはクリック制限にカウントされず、分析にも記録されません。

以下で識別されたその他すべてのボットはクリック制限にカウントされます。トラフィックを監視およびリダイレクトするコストはソースに関わらず同じであるため、です。

ブロックされたボット(ブロックページに遭遇したもの)もあなたの制限にカウントされません。

検索ボットのリスト

以下は、Linklyが識別する検索ボットとそのユーザーエージェントのリストです。必要に応じてブロックできます。

  • 200pleasebot 200PleaseBot
  • 360spider 360Spider
  • abot CrawlDaddy, abot
  • addthis AddThis
  • adldxbot Microsoft Bing Ads
  • admantx ADmantX Platform Semantic Analyzer
  • adsbot-google Google Adwords
  • advbot AdvBot
  • ahrefsbot Ahrefs バックリンク調査ツール
  • alexa Alexa Crawler
  • apache-httpclient Java httpライブラリ
  • apachebench ApacheBench (ab)
  • apis-google APIs-Google
  • appengine-google Google App Engine
  • applebot Apple Bot
  • archive.org_bot Internet Archive (archive.org)
  • ask jeeves Ask Jeeves
  • asynchttpclient Java httpおよびWebSocketクライアントライブラリ
  • awe.sm Awe.sm URLエクスパンダー
  • baidu Baidu
  • bdcbot Big Data Corp
  • bingbot Microsoft Bing
  • bingpreview Microsoft Bingプレビュー
  • bitlybot bit.ly bot
  • blekkobot Blekkobot
  • blexbot BLEXBot (webmeup)
  • bot@linkfluence.net Linkfluence bot
  • bufferbot BufferBot
  • buibui-checkbot buibui
  • butterfly Topsy Labs
  • buzztalk buzztalk
  • catchbot CatchBot (catchbot.com)
  • check_http Nagios monitor
  • cliqzbot Cliqzbot
  • cmradar/0.1 CMRadar/0.1
  • coldfusion ColdFusion httpライブラリ
  • commoncrawl CCBot
  • comodo-webinspector-crawler Comodo
  • crowsnest Crowsnest
  • curabot cura.yt
  • curl curl unix CLI httpクライアント
  • dap/nethttp DAP/NetHTTP
  • datagnionbot datagnion.com/bot.html
  • daumoa 韓国ポータルおよび検索エンジンインデックスボット
  • developers.google.com/+/web/snippet/ Google Plus
  • diffbot Diffbot
  • digitalpersona 指紋認証ソフトウェア HPフィンガープリントスキャナー
  • domain re-animator bot Domain Re-Animator Bot
  • domainsbot DomainsBot
  • domaintunocrawler DomainTuno
  • dotbot Dot Bot
  • duckduck Duck Duck Go
  • elb-healthchecker AWS ELB HealthChecker
  • embedly Embedly
  • eoaagent EOAAgent
  • eventmachine httpclient Ruby httpライブラリ
  • everyonesocialbot EveryoneSocial
  • evrinid Evri bot
  • exabot Exalead's bot
  • exaleadcloudview ExaleadCloudView
  • facebookexternalhit Facebook Bot
  • facebot Facebook Bot
  • feedburner RSSボット
  • feedfetcher-google Google Feedfetcher
  • findxbot Findxbot
  • flipboardproxy FlipboardProxy
  • friendfeedbot FriendFeed
  • genieo Genieo Webフィルターボット
  • getprismatic.com getprismatic.com
  • gigabot Gigabot spider
  • gimme60bot Gimme60 (gimme60.com)
  • gimmeusabot Gimme60 (gimme60.com)
  • go http package Go httpライブラリ
  • google page speed insights Google Page Speed Insights
  • google Web Preview Google Instant Previewsクローラー
  • google-structured-data-testing-tool Google-StructuredDataTestingTool
  • google-structureddatatestingtool Google-StructuredDataTestingTool
  • googlebot Google Bot
  • googlestackdrivermonitoring-uptimechecks GoogleStackdriverMonitoring-UptimeChecks
  • grapeshotcrawler GrapeshotCrawler
  • gravitybot Gravity Bot
  • hatena::bookmark Hatena::Bookmark
  • heritrix heritrix
  • htmlparser HTMLParser
  • http_request2 HTTP_Request2
  • httpclient HTTPClient
  • https://developers.google.com/+/web/snippet Google+ スニペットフェッチャー
  • hubspot HubSpot
  • ia_archiver Internet Archive (WayBackMachine)
  • icoreservice iCoreService
  • idmarch idmarch.org/bot.html
  • inagist URLリゾルバー
  • insieve Insieve Bot
  • insitesbot Insitesbot
  • instapaper Instapaper
  • istellabot IstellaBot
  • jack jack
  • jakarta commons Jakarta Commons HttpClient
  • java 汎用Java httpライブラリ
  • jetslide Jetslide
  • js-kit URLリゾルバー
  • kemvibot Kemvi
  • kimengi Kimengi Bot
  • knows.is knows.is
  • kojitsubot Kojitsubot
  • komodiabot KomodiaBot
  • kraken kraken
  • laconica Laconica
  • libwww-perl Perlクライアント-サーバーライブラリ
  • lijit crawler Lijit
  • linkdexbot Linkdex Bot
  • linkedinbot LinkedIn
  • linkscrawler LinksCrawler
  • linode Linode Longview
  • lipperhey Lipperhey
  • livelapbot Livelapbot
  • loadtimebot Load Time Bot
  • longurl URLエクスパンダーサービス
  • ltx71 ltx71.com
  • lumibot Lumibot
  • lwp-trivial 別のPerlライブラリ
  • magpie-crawler magpie-crawler
  • mail.ru_bot Mail.ru Bot
  • meanpathbot meanpath
  • mediapartners-google Google Adsenseボット
  • megaindex.ru MegaIndex
  • memorybot mignify.com/bot.html
  • metauri MetaURI
  • mfe_expand Mcafee spider
  • mir web crawler MIR Webクローラー
  • mj12bot Majestic-12 spider
  • mojeekbot Mojeek UK検索クローラー
  • mrchrome MrChrome
  • ms search 6.0 robot MS Search 6.0 Robot
  • msnbot-media Microsoftメディアボット
  • msnbot Microsoftボット
  • nerdybot NerdyBot
  • netcraft Netcraft
  • netstate netEstate NE Crawler
  • netvibes パーソナライズダッシュボードボット
  • netzcheckbot netzcheck
  • newrelicmonitor NewRelic monitor
  • newrelicpinger NewRelicPinger
  • newsme newsme
  • niki-bot niki-bot
  • ning NING - Yet Another Twitter Swarmer
  • nutch Apache検索スパイダー
  • openhosebot OpenHoseBot
  • orangebot OrangeBot
  • pagesinventory pagesinventory.com
  • panopta 監視サービス
  • paperlibot PaperLi
  • peerindex peerindex
  • percolatecrawler PercolateCrawler
  • perfectmarketkwtbot PerfectMarket
  • phantomjs PhantomJS
  • pingdom Pingdom監視
  • pinterest Pinterest
  • plukkie botje.com/plukkie.htm
  • privacyawarebot PrivacyAwareBot
  • proximic Proximic Spider
  • psbot-page Picsearch
  • publiclibraryarchive.org publiclibraryarchive.org
  • pycurl Python httpライブラリ
  • python-httplib2 Python-httplib2
  • python-requests Python httpライブラリ
  • python-urllib Python httpライブラリ
  • queryseeker QuerySeekerSpider
  • quicklook QuickLook
  • re-animator Domain Re-Animator Bot
  • readability Readability
  • rebelmouse RebelMouse
  • redditbot Reddit Bot
  • relateiq RelateIQ
  • riddler Riddler Bot
  • rogerbot SeoMoz spider
  • rssmicro RSS/Atom フィードロボット (rssmicro.com)
  • ruby Ruby
  • scrapy Scrapy
  • screaming frog seo spider Screaming Frog SEO Spider
  • searchmetricsbot SearchmetricsBot
  • semrushbot SEO分析ボット
  • seokicks SEOKicks
  • seznambot SeznamBot
  • shopwiki ShopWiki
  • shortlinktranslate リンク短縮機
  • showyoubot Showyou iOSアプリスパイダー
  • siege Joe Dog Siege
  • sistrix SISTRIX
  • siteuptime サイト監視サービス
  • slack Slackbot-LinkExpanding
  • slackbot Slack Bot
  • slurp Yahooスパイダー
  • smtbot SimilarTech
  • socialrank SocialRankIOBot
  • sogou 中国検索エンジン
  • spbot OpenLinkProfiler
  • spider 汎用Webスパイダー
  • spinn3r Spinn3r aggregator
  • sputnikbot SputnikBot
  • squider Squider
  • statuscake StatusCake
  • stripe Stripe
  • test certificate info C httpライブラリ?
  • tineye TinEye Bot
  • traackr Traackr Bot
  • trendictionbot Trendiction Search
  • turnitinbot TurnitinBot
  • tweetedtimes The Tweeted Times
  • tweetmemebot TweetMeMe Crawler
  • twikle ソーシャルWeb検索ボット
  • twitjobsearch TwitJobSearch
  • twitmunin Twitmunin
  • twitterbot Twitter URLエクスパンダー
  • twurly Twurly
  • typhoeus Typhoeus
  • umbot uberMetrics
  • unwindfetch Gnip
  • uptimerobot Uptime Robot
  • vagabondo Vagabondo
  • vb project Visual Basic
  • vigil Vigil
  • vkshare VKontake Sharer
  • voilabot VoilaBot
  • vrcrawler Venture Radar
  • wasalive-bot Wasalive Bots
  • watchsumo WatchSumo
  • wbsearchbot Ware Bay Best Buys
  • webscout Webscout
  • wesee WeSEE
  • wget wget unix CLI httpクライアント
  • wordpress WordPressスパイダー
  • wormly WormlyBot
  • wotbox Wotbox
  • xenu link sleuth Xenu Link Sleuth
  • xing-contenttabreceiver Xing bot
  • xovibot XoviBot
  • yacybot YaCy
  • yahoo-ad-monitoring Yahoo Ad monitoring
  • yandex Yandex
  • yeti Naver Corp
  • yourls YOURLS
  • zelist.ro フィードパーサー
  • zibb ZIBB spider
  • zitebot Zite
  • zyborg Zyborg

クラウドプロバイダーとして識別されるボット

多くのボットは自らをボットとして識別しませんが、インターネットサービスプロバイダーを追跡し、主要クラウドプロバイダーからのトラフィックを同様にボットである可能性が高いと識別します。

  • Google Cloud
  • Microsoft Corporation
  • OVH SAS
  • DigitalOcean
  • Huawei Clouds
  • Google-private-cloud
  • Facebook
  • Amazon.com
  • Google Proxy
  • Omonia d.o.o.
  • ColoCrossing

検索ボット FAQ

Linklyはボットをどのように検出しますか?

Linklyはユーザーエージェント文字列を通じてボットを識別し(多くのボットは自らを発表します)、トラフィックが既知のクラウドホスティングプロバイダーやデータセンターから発信しているかどうかを確認します。

このリストに載っていないボットはありますか?

ボット検出は定期的に更新されます。このリストに載っていないボットからのトラフィックが表示される場合は、お問い合わせください。追加いたします。

なぜ実際のユーザーのクリックがボットとしてマークされることがありますか?

VPNまたは企業ネットワーク上のユーザーは、トラフィックがデータセンター経由でルーティングされるため、ボットとしてフラグが付けられる可能性があります。詳細については、VPNトラフィックに関する記事を参照してください。

特定のボットがリンクを訪問したかどうか確認できますか?

はい。トラフィックレポートでボットタブをクリックすると、ユーザーエージェント別のボットトラフィックの内訳が表示されます。

毎月500クリックを無料で追跡できます。