Search results for 'crawler' - The Ruby Toolbox

Projects

Bugfix forks are hidden

baidu_crawler

0.0

No commit activity in last 3 years

No release in over 3 years

baidu_crawler debbbbie/baidu_crawler Homepage

The Baidu Crawler is to crawl data with your demmand

2019

2020

2021

2022

2023

2024

5,973

0

Current version

0.0.1

1

2012-09-01

2012-09-01

Show more project details Compare

yz_crawler

0.0

No release in over 3 years

yz_crawler Homepage

A simple web crawler gem

2019

2020

2021

2022

2023

2024

3,535

Current version

0.0.1

1

2015-03-22

2015-03-22

Show more project details Compare

govuk_seed_crawler

0.0

Repository is archived

No release in over a year

govuk_seed_crawler alphagov/govuk_seed_crawler Homepage

Retrieves a list of URLs to seed the crawler by publishing them to a RabbitMQ exchange.

2019

2020

2021

2022

2023

2024

11,082

0

Current version

3.2.1

7

2015-08-28

2023-03-22

Show more project details Compare

capybara_crawler

0.0

No commit activity in last 3 years

No release in over 3 years

capybara_crawler rainchen/capybara_crawler Homepage

a simple web crawler using DSL of capybara

2019

2020

2021

2022

2023

2024

2,556

0

Current version

0.1.0

1

2017-03-26

2017-03-26

Show more project details Compare

dk_crawler

0.0

No release in over 3 years

dk_crawler Homepage

A simple web crawler gem

2019

2020

2021

2022

2023

2024

2,143

Current version

0.0.1

1

2018-04-01

2018-04-01

Show more project details Compare

middleman-crawler

0.0

No commit activity in last 3 years

No release in over 3 years

middleman-crawler welaika/middleman-crawler Homepage

it starts a crawler for Middleman sites

2019

2020

2021

2022

2023

2024

5,335

4

Current version

0.0.2

2

2016-07-05

2016-07-05

Show more project details Compare

mymav_crawler

0.0

No release in over 3 years

mymav_crawler Homepage

Web crawler to get courses from XML pages at mymav.uta

2019

2020

2021

2022

2023

2024

2,321

Current version

2.0.0

1

2017-05-12

2017-05-12

Show more project details Compare

news_crawler

0.0

No commit activity in last 3 years

No release in over 3 years

news_crawler haqduong/news_crawler Homepage

A flexible, modular web crawler

2019

2020

2021

2022

2023

2024

22,076

1

Current version

0.0.4

9

2013-07-21

2013-08-16

Show more project details Compare

event-crawler

0.0

Repository is gone

No release in over 3 years

event-crawler Homepage

Generic Web crawler with a DSL that parses event-related data from web pages

2019

2020

2021

2022

2023

2024

4,509

Current version

0.1.0

1

2011-11-14

2011-11-14

Show more project details Compare

adsense_crawler_for_private

0.0

No release in over 3 years

Low commit activity in last 3 years

adsense_crawler_for_private holli/adsense_crawler_for_private Homepage

Easy way to enable AdSense crawler to login and see private or custom pages in your rails application. Basically one custom login filter. Gem enables you to easily slightly increase revenues from Google AdSense/AdWords. It makes it easy to enable crawling on private pages and so get better target...

2019

2020

2021

2022

2023

2024

24,458

2

Current version

1.2.1

6

2011-12-29

2019-06-16

Show more project details Compare

instagram-crawler

0.08

No release in over 3 years

Low commit activity in last 3 years

There's a lot of open issues

instagram-crawler mgleon08/instagram-crawler Homepage

Crawl instagram photos, posts and videos for download.

2019

2020

2021

2022

2023

2024

7,383

197

Current version

0.3.0

4

2018-11-23

2019-04-14

Show more project details Compare

rubyretriever

0.08

No release in over 3 years

Low commit activity in last 3 years

There's a lot of open issues

rubyretriever joenorton/rubyretriever Homepage

Asynchronous web crawler, scraper and file harvester

2019

2020

2021

2022

2023

2024

67,465

141

Current version

1.4.6

29

2014-05-25

2016-04-11

Show more project details Compare

polipus

0.07

No commit activity in last 3 years

No release in over 3 years

There's a lot of open issues

polipus taganaka/polipus Homepage

An easy to use distributed web-crawler framework based on Redis

2019

2020

2021

2022

2023

2024

51,665

93

Current version

0.5.1

20

2014-01-05

2015-07-17

Show more project details Compare

arachnid

0.03

No commit activity in last 3 years

No release in over 3 years

arachnid dchuk/arachnid Homepage

Arachnid is a web crawler that relies on Bloom Filters to efficiently store visited urls and Typhoeus to avoid the overhead of Mechanize when crawling every page on a domain.

2019

2020

2021

2022

2023

2024

48,877

38

Current version

0.4.1

12

2011-11-11

2014-01-16

Show more project details Compare

wayback_archiver

0.03

No release in over 3 years

Low commit activity in last 3 years

wayback_archiver buren/wayback_archiver Homepage

Post URLs to Wayback Machine (Internet Archive), using a crawler, from Sitemap(s) or a list of URLs.

2019

2020

2021

2022

2023

2024

46,363

57

Current version

1.4.0

21

2014-07-17

2021-04-23

Show more project details Compare

google_ajax_crawler

0.03

No commit activity in last 3 years

No release in over 3 years

google_ajax_crawler benkitzelman/google-ajax-crawler Homepage

Rack Middleware adhering to the Google Ajax Crawling Scheme, using a headless browser to render JS heavy pages and serve a dom snapshot of the rendered state to a requesting search engine.

2019

2020

2021

2022

2023

2024

15,907

58

Current version

0.2.0

5

2013-03-16

2013-07-13

Show more project details Compare

validate-website

0.03

Low commit activity in last 3 years

No release in over a year

validate-website spk/validate-website Homepage

validate-website is a web crawler for checking the markup validity with XML Schema / DTD and not found urls.

2019

2020

2021

2022

2023

2024

125,957

38

Current version

1.12.0

50

2009-10-24

2022-11-15

Show more project details Compare

grell

0.02

No commit activity in last 3 years

No release in over 3 years

grell mdsol/grell Homepage

Ruby web crawler using PhantomJS

2019

2020

2021

2022

2023

2024

86,886

46

Current version

2.1.2

21

2015-05-07

2021-02-17

Show more project details Compare

cosmicrawler

0.02

Repository is archived

No commit activity in last 3 years

No release in over 3 years

cosmicrawler bash0c7/cosmicrawler Homepage

Cosmicrawler is crawler library for Ruby. It provides scalable asynchronous crawling by (http|file|etc) using EventMachine.

2019

2020

2021

2022

2023

2024

5,174

44

Current version

0.0.1

1

2013-03-11

2013-03-11

Show more project details Compare

marmiton_crawler

0.01

Repository is archived

No commit activity in last 3 years

No release in over 3 years

marmiton_crawler madeindjs/marmiton_crawler Homepage

A web scrawler to get a Marmiton's recipe

2019

2020

2021

2022

2023

2024

4,683

6

Current version

1.0.3

2

2016-10-09

2016-11-28

Show more project details Compare