Robots de Recherche

Qu'est-ce qu'un robot de recherche ?

Un robot de recherche, parfois appelé spider, est un robot qui navigue en permanence sur internet, généralement dans le but de construire un index de recherche.

Les robots peuvent artificiellement gonfler les chiffres de trafic, il est donc important d'être conscient de leur existence.

Il existe également d'autres types de robots utilisés pour la fraude au clic. En savoir plus sur la fraude au clic et comment la prévenir.

Les robots de recherche et Linkly

Linkly peut détecter les robots de recherche et les spiders qui se révèlent délibérément. Vous pouvez voir quels clics ont été attribués aux robots dans la section Robots du rapport de trafic.

Nous avons un article sur le trafic des robots et comment bloquer les robots.

Traitement Spécial pour les Crawlers de Réseaux Sociaux

Linkly dispose d'un traitement amélioré pour les crawlers de réseaux sociaux de Facebook, YouTube, Google, LinkedIn et X.

Lorsque le trafic de ces crawlers atteint vos liens :

  • Il n'est pas enregistré dans vos analyses
  • Il ne compte pas dans vos limites de clics
  • Le crawler est redirigé de manière transparente vers la destination correcte
  • Ces crawlers sont toujours autorisés, même lorsque la fonction « bloquer les robots » est activée

Cela empêche les crawlers de réseaux sociaux de consommer vos limites de clics tout en leur permettant de générer des aperçus et de vérifier vos liens.

Bot traffic in Linkly traffic report
Bot traffic in Linkly traffic report

Bloquer les Robots de Suivre les Liens

Linkly peut bloquer les robots et les spiders de recherche de suivre vos liens. Voir Trafic des Robots pour les instructions sur l'activation du blocage des robots.

Important : Les crawlers de réseaux sociaux de Facebook, YouTube, Google, LinkedIn et X sont toujours autorisés même lorsque le blocage est activé, afin que les aperçus de liens continuent de fonctionner.

Les Robots Comptent-ils dans les Limites de Clics ?

Les crawlers de réseaux sociaux de Facebook, YouTube, Google, LinkedIn et X ne comptent pas dans vos limites de clics et ne sont pas enregistrés dans vos analyses.

Tous les autres robots identifiés ci-dessous comptent dans vos limites de clics, car il en coûte autant de surveiller et rediriger le trafic quelle que soit la source.

Les robots bloqués (ceux qui rencontrent une page de blocage) ne comptent pas non plus dans vos limites.

Liste des Robots de Recherche

Voici une liste de robots de recherche et leurs user-agents que Linkly identifie, et qui peuvent être bloqués si nécessaire.

  • 200pleasebot 200PleaseBot
  • 360spider 360Spider
  • abot CrawlDaddy, abot
  • addthis AddThis
  • adldxbot Microsoft Bing Ads
  • admantx ADmantX Platform Semantic Analyzer
  • adsbot-google Google Adwords
  • advbot AdvBot
  • ahrefsbot Ahrefs backlinks research tool
  • alexa Alexa Crawler
  • apache-httpclient Java http library
  • apachebench ApacheBench (ab)
  • apis-google APIs-Google
  • appengine-google Google App Engine
  • applebot Apple Bot
  • archive.org_bot Internet Archive (archive.org)
  • ask jeeves Ask Jeeves
  • asynchttpclient Java http and WebSocket client library
  • awe.sm Awe.sm URL expander
  • baidu Baidu
  • bdcbot Big Data Corp
  • bingbot Microsoft Bing
  • bingpreview Microsoft Bing preview
  • bitlybot bit.ly bot
  • blekkobot Blekkobot
  • blexbot BLEXBot (webmeup)
  • bot@linkfluence.net Linkfluence bot
  • bufferbot BufferBot
  • buibui-checkbot buibui
  • butterfly Topsy Labs
  • buzztalk buzztalk
  • catchbot CatchBot (catchbot.com)
  • check_http Nagios monitor
  • cliqzbot Cliqzbot
  • cmradar/0.1 CMRadar/0.1
  • coldfusion ColdFusion http library
  • commoncrawl CCBot
  • comodo-webinspector-crawler Comodo
  • crowsnest Crowsnest
  • curabot cura.yt
  • curl curl unix CLI http client
  • dap/nethttp DAP/NetHTTP
  • datagnionbot datagnion.com/bot.html
  • daumoa Korean portal and search engine indexing bot
  • developers.google.com/+/web/snippet/ Google Plus
  • diffbot Diffbot
  • digitalpersona fingerprint software HP Fingerprint scanner
  • domain re-animator bot Domain Re-Animator Bot
  • domainsbot DomainsBot
  • domaintunocrawler DomainTuno
  • dotbot Dot Bot
  • duckduck Duck Duck Go
  • elb-healthchecker AWS ELB HealthChecker
  • embedly Embedly
  • eoaagent EOAAgent
  • eventmachine httpclient Ruby http library
  • everyonesocialbot EveryoneSocial
  • evrinid Evri bot
  • exabot Exalead's bot
  • exaleadcloudview ExaleadCloudView
  • facebookexternalhit Facebook Bot
  • facebot Facebook Bot
  • feedburner RSS bot
  • feedfetcher-google Google Feedfetcher
  • findxbot Findxbot
  • flipboardproxy FlipboardProxy
  • friendfeedbot FriendFeed
  • genieo Genieo Web filter bot
  • getprismatic.com getprismatic.com
  • gigabot Gigabot spider
  • gimme60bot Gimme60 (gimme60.com)
  • gimmeusabot Gimme60 (gimme60.com)
  • go http package Go http library
  • google page speed insights Google Page Speed Insights
  • google Web Preview Google Instant Previews crawler
  • google-structured-data-testing-tool Google-StructuredDataTestingTool
  • google-structureddatatestingtool Google-StructuredDataTestingTool
  • googlebot Google Bot
  • googlestackdrivermonitoring-uptimechecks GoogleStackdriverMonitoring-UptimeChecks
  • grapeshotcrawler GrapeshotCrawler
  • gravitybot Gravity Bot
  • hatena::bookmark Hatena::Bookmark
  • heritrix heritrix
  • htmlparser HTMLParser
  • http_request2 HTTP_Request2
  • httpclient HTTPClient
  • https://developers.google.com/+/web/snippet Google+ Snippet Fetcher
  • hubspot HubSpot
  • ia_archiver Internet Archive (WayBackMachine)
  • icoreservice iCoreService
  • idmarch idmarch.org/bot.html
  • inagist URL resolver
  • insieve Insieve Bot
  • insitesbot Insitesbot
  • instapaper Instapaper
  • istellabot IstellaBot
  • jack jack
  • jakarta commons Jakarta Commons HttpClient
  • java Generic Java http library
  • jetslide Jetslide
  • js-kit URL resolver
  • kemvibot Kemvi
  • kimengi Kimengi Bot
  • knows.is knows.is
  • kojitsubot Kojitsubot
  • komodiabot KomodiaBot
  • kraken kraken
  • laconica Laconica
  • libwww-perl Perl client-server library
  • lijit crawler Lijit
  • linkdexbot Linkdex Bot
  • linkedinbot LinkedIn
  • linkscrawler LinksCrawler
  • linode Linode Longview
  • lipperhey Lipperhey
  • livelapbot Livelapbot
  • loadtimebot Load Time Bot
  • longurl URL expander service
  • ltx71 ltx71.com
  • lumibot Lumibot
  • lwp-trivial Another Perl library
  • magpie-crawler magpie-crawler
  • mail.ru_bot Mail.ru Bot
  • meanpathbot meanpath
  • mediapartners-google Google Adsense bot
  • megaindex.ru MegaIndex
  • memorybot mignify.com/bot.html
  • metauri MetaURI
  • mfe_expand Mcafee spider
  • mir web crawler MIR web crawler
  • mj12bot Majestic-12 spider
  • mojeekbot Mojeek UK search crawler
  • mrchrome MrChrome
  • ms search 6.0 robot MS Search 6.0 Robot
  • msnbot-media Microsoft media bot
  • msnbot Microsoft bot
  • nerdybot NerdyBot
  • netcraft Netcraft
  • netstate netEstate NE Crawler
  • netvibes Personalized dashboard bot
  • netzcheckbot netzcheck
  • newrelicmonitor NewRelic monitor
  • newrelicpinger NewRelicPinger
  • newsme newsme
  • niki-bot niki-bot
  • ning NING - Yet Another Twitter Swarmer
  • nutch Apache search spider
  • openhosebot OpenHoseBot
  • orangebot OrangeBot
  • pagesinventory pagesinventory.com
  • panopta Monitoring service
  • paperlibot PaperLi
  • peerindex peerindex
  • percolatecrawler PercolateCrawler
  • perfectmarketkwtbot PerfectMarket
  • phantomjs PhantomJS
  • pingdom Pingdom monitoring
  • pinterest Pinterest
  • plukkie botje.com/plukkie.htm
  • privacyawarebot PrivacyAwareBot
  • proximic Proximic Spider
  • psbot-page Picsearch
  • publiclibraryarchive.org publiclibraryarchive.org
  • pycurl Python http library
  • python-httplib2 Python-httplib2
  • python-requests Python http library
  • python-urllib Python http library
  • queryseeker QuerySeekerSpider
  • quicklook QuickLook
  • re-animator Domain Re-Animator Bot
  • readability Readability
  • rebelmouse RebelMouse
  • redditbot Reddit Bot
  • relateiq RelateIQ
  • riddler Riddler Bot
  • rogerbot SeoMoz spider
  • rssmicro RSS/Atom Feed Robot (rssmicro.com)
  • ruby Ruby
  • scrapy Scrapy
  • screaming frog seo spider Screaming Frog SEO Spider
  • searchmetricsbot SearchmetricsBot
  • semrushbot SEO analysis bot
  • seokicks SEOKicks
  • seznambot SeznamBot
  • shopwiki ShopWiki
  • shortlinktranslate Link shortener
  • showyoubot Showyou iOS app spider
  • siege Joe Dog Siege
  • sistrix SISTRIX
  • siteuptime Site monitoring services
  • slack Slackbot-LinkExpanding
  • slackbot Slack Bot
  • slurp Yahoo spider
  • smtbot SimilarTech
  • socialrank SocialRankIOBot
  • sogou Chinese search engine
  • spbot OpenLinkProfiler
  • spider generic web spider
  • spinn3r Spinn3r aggregator
  • sputnikbot SputnikBot
  • squider Squider
  • statuscake StatusCake
  • stripe Stripe
  • test certificate info C http library?
  • tineye TinEye Bot
  • traackr Traackr Bot
  • trendictionbot Trendiction Search
  • turnitinbot TurnitinBot
  • tweetedtimes The Tweeted Times
  • tweetmemebot TweetMeMe Crawler
  • twikle Social web search bot
  • twitjobsearch TwitJobSearch
  • twitmunin Twitmunin
  • twitterbot Twitter URL expander
  • twurly Twurly
  • typhoeus Typhoeus
  • umbot uberMetrics
  • unwindfetch Gnip
  • uptimerobot Uptime Robot
  • vagabondo Vagabondo
  • vb project Visual Basic
  • vigil Vigil
  • vkshare VKontake Sharer
  • voilabot VoilaBot
  • vrcrawler Venture Radar
  • wasalive-bot Wasalive Bots
  • watchsumo WatchSumo
  • wbsearchbot Ware Bay Best Buys
  • webscout Webscout
  • wesee WeSEE
  • wget wget unix CLI http client
  • wordpress WordPress spider
  • wormly WormlyBot
  • wotbox Wotbox
  • xenu link sleuth Xenu Link Sleuth
  • xing-contenttabreceiver Xing bot
  • xovibot XoviBot
  • yacybot YaCy
  • yahoo-ad-monitoring Yahoo Ad monitoring
  • yandex Yandex
  • yeti Naver Corp
  • yourls YOURLS
  • zelist.ro feed parser
  • zibb ZIBB spider
  • zitebot Zite
  • zyborg Zyborg

Fournisseurs Cloud Identifiés comme Robots

De nombreux robots ne s'identifient pas en tant que tels, mais nous suivons les fournisseurs de services internet et identifions le trafic des principaux fournisseurs cloud comme étant probablement des robots également.

  • Google Cloud
  • Microsoft Corporation
  • OVH SAS
  • DigitalOcean
  • Huawei Clouds
  • Google-private-cloud
  • Facebook
  • Amazon.com
  • Google Proxy
  • Omonia d.o.o.
  • ColoCrossing

FAQ sur les Robots de Recherche

Comment Linkly détecte-t-il les robots ?

Linkly identifie les robots grâce à leur chaîne d'agent utilisateur (de nombreux robots s'annoncent) et en vérifiant si le trafic provient de fournisseurs d'hébergement cloud connus ou de centres de données.

Un robot manque-t-il dans cette liste ?

Nous mettons régulièrement à jour notre détection de robots. Si vous constatez du trafic provenant d'un robot qui ne figure pas sur cette liste, contactez-nous et nous l'ajouterons.

Pourquoi certains clics sont-ils marqués comme robots alors qu'il s'agit de vrais utilisateurs ?

Les utilisateurs sur des VPN ou des réseaux d'entreprise peuvent être signalés comme robots car leur trafic passe par des centres de données. Consultez notre article sur le trafic VPN pour plus d'informations.

Puis-je voir quel robot spécifique a visité mon lien ?

Oui. Dans le rapport de trafic, cliquez sur l'onglet Robots pour voir une répartition du trafic des robots par agent utilisateur.

Track 1000 monthly clicks with all features included.

No credit card required