海葵擦洗一定的页面深度

isunt 发布于 2018-10-11 ruby 最后更新 2018-10-11 22:59 19 浏览

我不理解如何使用海葵的触手部分。如果我正确地解释它,我觉得我可以使用它来仅从根部擦除特定的页面深度。

  Anemone.crawl(start_url) do |anemone|
  tentacle.new(i think but not working)
  anemone.on_every_page do |page|
      puts page.depth
      puts page.url
    end
  end
我想让它远离根源3。 这是rdoc所说的 http://anemone.rubyforge.org/doc/index.html
Public Class methods
new(link_queue, page_queue, opts = {})
Create a new Tentacle
Public Instance methods
run()
Gets links from @link_queue, and returns the fetched Page objects into @page_queue
谢谢
已邀请:

quo_et

赞同来自:

得到它了 :)

Anemone.crawl(domain, :depth_limit => 1) do | anemone |
  anemone.storage = Anemone::Storage.MongoDB
  anemone.on_every_page do |page|
      puts page.url
      puts page.depth
end
end

要回复问题请先登录注册