Search results for 'crawler' - The Ruby Toolbox

Projects

Bugfix forks are hidden

arb-crawler

0.0

No commit activity in last 3 years

No release in over 3 years

arb-crawler arybin-cn/arb-crawler Homepage

Web page crawler.

2019

2020

2021

2022

2023

2024

8,872

1

Current version

1.0.3

4

2017-02-12

2017-08-06

Show more project details Compare

middleman-crawler

0.0

No commit activity in last 3 years

No release in over 3 years

middleman-crawler welaika/middleman-crawler Homepage

it starts a crawler for Middleman sites

2019

2020

2021

2022

2023

2024

5,328

4

Current version

0.0.2

2

2016-07-05

2016-07-05

Show more project details Compare

watir-for-crawler

0.0

No commit activity in last 3 years

No release in over 3 years

watir-for-crawler bdkhanh/watir-for-crawler Homepage

Simple Gem Using Watir For Phantom Crawler

2019

2020

2021

2022

2023

2024

2,178

1

Current version

0.1.0

1

2019-04-28

2019-04-28

Show more project details Compare

rubygems-crawler

0.0

No release in over 3 years

rubygems-crawler Homepage

A very simple crawler for RubyGems.org used to demo the power of ElasticSearch at RubyConf 2013

2019

2020

2021

2022

2023

2024

6,037

Current version

0.1.0

2

2013-10-28

2013-10-28

Show more project details Compare

crawler_sample

0.0

No commit activity in last 3 years

No release in over 3 years

crawler_sample shigekidoumae/crawler_sample

This gem is a web crawler sample code.So I don't reccmmend that you use.

2019

2020

2021

2022

2023

2024

3,972

0

Current version

0.0.1

1

2013-06-11

2013-06-11

Show more project details Compare

arb-bs

0.0

No commit activity in last 3 years

No release in over 3 years

arb-bs arybin-cn/arb-bs Homepage

A demo of Web Crawler using arb-crawler

2019

2020

2021

2022

2023

2024

19,723

0

Current version

1.1.4

10

2017-02-13

2018-04-12

Show more project details Compare

creepy-crawler

0.0

No commit activity in last 3 years

No release in over 3 years

creepy-crawler udryan10/creepy-crawler Homepage

web crawler that generates a sitemap to a neo4j database. It will also store broken_links and total number of pages on site

2019

2020

2021

2022

2023

2024

6,585

5

Current version

1.0.2

2

2014-05-10

2014-05-10

Show more project details Compare

news_crawler

0.0

No commit activity in last 3 years

No release in over 3 years

news_crawler haqduong/news_crawler Homepage

A flexible, modular web crawler

2019

2020

2021

2022

2023

2024

22,038

1

Current version

0.0.4

9

2013-07-21

2013-08-16

Show more project details Compare

stupid_crawler

0.0

No release in over 3 years

Low commit activity in last 3 years

stupid_crawler buren/stupid_crawler Homepage

Stupid crawler that looks for URLs on a given site. Result is saved as two CSV files one with found URLs and another with failed URLs.

2019

2020

2021

2022

2023

2024

3,728

1

Current version

0.2.1

2

2017-09-10

2017-09-10

Show more project details Compare

mymav_crawler

0.0

No release in over 3 years

mymav_crawler Homepage

Web crawler to get courses from XML pages at mymav.uta

2019

2020

2021

2022

2023

2024

2,315

Current version

2.0.0

1

2017-05-12

2017-05-12

Show more project details Compare

instagram-crawler

0.08

No release in over 3 years

Low commit activity in last 3 years

There's a lot of open issues

instagram-crawler mgleon08/instagram-crawler Homepage

Crawl instagram photos, posts and videos for download.

2019

2020

2021

2022

2023

2024

7,370

197

Current version

0.3.0

4

2018-11-23

2019-04-14

Show more project details Compare

rubyretriever

0.08

No release in over 3 years

Low commit activity in last 3 years

There's a lot of open issues

rubyretriever joenorton/rubyretriever Homepage

Asynchronous web crawler, scraper and file harvester

2019

2020

2021

2022

2023

2024

67,322

141

Current version

1.4.6

29

2014-05-25

2016-04-11

Show more project details Compare

polipus

0.07

No commit activity in last 3 years

No release in over 3 years

There's a lot of open issues

polipus taganaka/polipus Homepage

An easy to use distributed web-crawler framework based on Redis

2019

2020

2021

2022

2023

2024

51,584

93

Current version

0.5.1

20

2014-01-05

2015-07-17

Show more project details Compare

wayback_archiver

0.03

No release in over 3 years

Low commit activity in last 3 years

wayback_archiver buren/wayback_archiver Homepage

Post URLs to Wayback Machine (Internet Archive), using a crawler, from Sitemap(s) or a list of URLs.

2019

2020

2021

2022

2023

2024

46,250

57

Current version

1.4.0

21

2014-07-17

2021-04-23

Show more project details Compare

arachnid

0.03

No commit activity in last 3 years

No release in over 3 years

arachnid dchuk/arachnid Homepage

Arachnid is a web crawler that relies on Bloom Filters to efficiently store visited urls and Typhoeus to avoid the overhead of Mechanize when crawling every page on a domain.

2019

2020

2021

2022

2023

2024

48,815

38

Current version

0.4.1

12

2011-11-11

2014-01-16

Show more project details Compare

google_ajax_crawler

0.03

No commit activity in last 3 years

No release in over 3 years

google_ajax_crawler benkitzelman/google-ajax-crawler Homepage

Rack Middleware adhering to the Google Ajax Crawling Scheme, using a headless browser to render JS heavy pages and serve a dom snapshot of the rendered state to a requesting search engine.

2019

2020

2021

2022

2023

2024

15,865

58

Current version

0.2.0

5

2013-03-16

2013-07-13

Show more project details Compare

validate-website

0.03

Low commit activity in last 3 years

No release in over a year

validate-website spk/validate-website Homepage

validate-website is a web crawler for checking the markup validity with XML Schema / DTD and not found urls.

2019

2020

2021

2022

2023

2024

125,642

38

Current version

1.12.0

50

2009-10-24

2022-11-15

Show more project details Compare

grell

0.02

No commit activity in last 3 years

No release in over 3 years

grell mdsol/grell Homepage

Ruby web crawler using PhantomJS

2019

2020

2021

2022

2023

2024

86,675

46

Current version

2.1.2

21

2015-05-07

2021-02-17

Show more project details Compare

cosmicrawler

0.02

Repository is archived

No commit activity in last 3 years

No release in over 3 years

cosmicrawler bash0c7/cosmicrawler Homepage

Cosmicrawler is crawler library for Ruby. It provides scalable asynchronous crawling by (http|file|etc) using EventMachine.

2019

2020

2021

2022

2023

2024

5,078

44

Current version

0.0.1

1

2013-03-11

2013-03-11

Show more project details Compare

apollo-crawler

0.01

No commit activity in last 3 years

No release in over 3 years

apollo-crawler korczis/apollo-crawler Homepage

Gem for crawling data from external sources

2019

2020

2021

2022

2023

2024

267,075

0

Current version

0.1.31

70

2013-02-23

2013-03-27

Show more project details Compare