Search results for 'crawler' - The Ruby Toolbox

Easy way to enable AdSense crawler to login and see private or custom pages in your rails application. Basically one custom login filter. Gem enables you to easily slightly increase revenues from Google AdSense/AdWords. It makes it easy to enable crawling on private pages and so get better target...

2020

2021

2022

2023

2024

2025

26,041

1.2.1

2011-12-29

2019-06-16

Show more project details Compare

instagram-crawler

0.06

No release in over 3 years

Low commit activity in last 3 years

There's a lot of open issues

instagram-crawler mgleon08/instagram-crawler Homepage

Crawl instagram photos, posts and videos for download.

2020

2021

2022

2023

2024

2025

8,245

201

0.3.0

2018-11-23

2019-04-14

Show more project details Compare

rubyretriever

0.06

No release in over 3 years

Low commit activity in last 3 years

There's a lot of open issues

rubyretriever joenorton/rubyretriever Homepage

Asynchronous web crawler, scraper and file harvester

2020

2021

2022

2023

2024

2025

72,212

143

1.4.6

2014-05-25

2016-04-11

Show more project details Compare

polipus

0.05

No commit activity in last 3 years

No release in over 3 years

There's a lot of open issues

polipus taganaka/polipus Homepage

An easy to use distributed web-crawler framework based on Redis

2020

2021

2022

2023

2024

2025

55,922

0.5.1

2014-01-05

2015-07-17

Show more project details Compare

wayback_archiver

0.02

Low commit activity in last 3 years

A long-lived project that still receives updates

wayback_archiver buren/wayback_archiver Homepage

Post URLs to Wayback Machine (Internet Archive), using a crawler, from Sitemap(s) or a list of URLs.

2020

2021

2022

2023

2024

2025

52,937

1.5.0

2014-07-17

2024-12-11

Show more project details Compare

validate-website

0.02

Low commit activity in last 3 years

No release in over a year

validate-website spk/validate-website Homepage

validate-website is a web crawler for checking the markup validity with XML Schema / DTD and not found urls.

2020

2021

2022

2023

2024

2025

135,343

1.12.0

2009-10-24

2022-11-15

Show more project details Compare

grell

0.02

No commit activity in last 3 years

No release in over 3 years

grell mdsol/grell Homepage

Ruby web crawler using PhantomJS

2020

2021

2022

2023

2024

2025

100,269

2.1.2

2015-05-07

2021-02-17

Show more project details Compare

arachnid

0.02

No commit activity in last 3 years

No release in over 3 years

arachnid dchuk/arachnid Homepage

Arachnid is a web crawler that relies on Bloom Filters to efficiently store visited urls and Typhoeus to avoid the overhead of Mechanize when crawling every page on a domain.

2020

2021

2022

2023

2024

2025

51,645

0.4.1

2011-11-11

2014-01-16

Show more project details Compare

google_ajax_crawler

0.02

No commit activity in last 3 years

No release in over 3 years

google_ajax_crawler benkitzelman/google-ajax-crawler Homepage

Rack Middleware adhering to the Google Ajax Crawling Scheme, using a headless browser to render JS heavy pages and serve a dom snapshot of the rendered state to a requesting search engine.

2020

2021

2022

2023

2024

2025

17,029

0.2.0

2013-03-16

2013-07-13

Show more project details Compare

arachnid2

0.01

Web Content Scrapers

No release in over 3 years

Low commit activity in last 3 years

arachnid2 samnissen/arachnid2 Homepage

A simple, fast web crawler

2020

2021

2022

2023

2024

2025

32,989

0.4.0

2018-05-29

2020-07-15

Show more project details Compare

driller

0.01

No commit activity in last 3 years

No release in over 3 years

driller shashikant86/driller Homepage

Driller is a command line Ruby based web crawler based on Anemone. Driller can crawl website and reports error pages and slow pages and generates HTML reports.

2020

2021

2022

2023

2024

2025

37,182

0.1.4

2015-05-10

2015-05-18

Show more project details Compare