Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

请问代理ip这里怎么弄 #124

Closed
angolin22 opened this issue Jan 7, 2020 · 20 comments
Closed

请问代理ip这里怎么弄 #124

angolin22 opened this issue Jan 7, 2020 · 20 comments

Comments

@angolin22
Copy link

爬取一部分数据后,报错,ip被封了。请问代理ip那里的fetch_proxy函数该怎样解决

@gyqGitHub
Copy link

大佬,我也遇到了这个问题,请问你也解决了吗 @XiaolinFan

@nghuyong
Copy link
Owner

nghuyong commented Feb 4, 2020

这个函数返回一个代理IP即可,这个代理IP你可以通过买代理IP的服务得到

@gyqGitHub
Copy link

这个函数返回一个代理IP即可,这个代理IP你可以通过买代理IP的服务得到

找了亿牛云,但是接入还需要输入账户密码,不知道怎么改,哪个网站可以直接给代理ip的,大佬能推荐一个吗 @ nghuyong

@nghuyong
Copy link
Owner

nghuyong commented Feb 5, 2020

我用的是 快代理

@gyqGitHub
Copy link

我用的是 快代理

谢谢!!!问题已解决

@arthur-cen
Copy link
Contributor

我用的是 快代理

可否给个使用快代理建立IP池的代码示例?我用了他们官方的API scrapy代码示例 但是在爬的时候总是不成功。

@sch919131030
Copy link

我用的是 快代理

谢谢!!!问题已解决

请问你是买的快代理的哪一种?是隧道代理吗?

@muyufujianxiaobawang
Copy link

请问微博关注、粉丝都只能看五页,这个这么破啊

@PeiyangTang
Copy link

请问微博关注、粉丝都只能看五页,这个这么破啊

你需要获得你要爬取人的授权, 拿到token,才能看到所有的关注和粉丝

@mango941231
Copy link

我用的是 快代理

用的哪个套餐呢 比较适合的

@arthur-cen
Copy link
Contributor

arthur-cen commented Jul 6, 2020

我用的是 快代理

用的哪个套餐呢 比较适合的

我用了他们的隧道代理,感觉最方便。
下面是代码示例,购买后只要替换<你的用户名>和<你的密码>即可:

只要改写middlewares.py中的IPProxyMiddleware class 即可:

class IPProxyMiddleware(object):
    def process_request(self, request, spider):
        proxy = "tps125.kdlapi.com:15818"
        request.meta['proxy'] = "https://%(proxy)s" % {'proxy': proxy}
        # 用户名密码认证
        username = <你的用户名>
        password= <你的密码>
        request.headers['Proxy-Authorization'] = basic_auth_header(username, password)  # 白名单认证可注释此行
        request.headers['Accept-Encoding']='gzip'
        return None

@kuaidaili-dev
Copy link

我用的是 快代理

可否给个使用快代理建立IP池的代码示例?我用了他们官方的API scrapy代码示例 但是在爬的时候总是不成功。

您好,我们的代码样例新增了Python-Scrapy的本地IP池维护,您可以参考参考。

@no1991
Copy link

no1991 commented Nov 21, 2022

我先拿到一次数据, 然后程序报错raise error.ReactorNotRestartable(), 之后用了快代理,也还是不行

@no1991
Copy link

no1991 commented Nov 21, 2022

我用的是 快代理

用的哪个套餐呢 比较适合的

我用了他们的隧道代理,感觉最方便。 下面是代码示例,购买后只要替换<你的用户名>和<你的密码>即可:

只要改写middlewares.py中的IPProxyMiddleware class 即可:

class IPProxyMiddleware(object):
    def process_request(self, request, spider):
        proxy = "tps125.kdlapi.com:15818"
        request.meta['proxy'] = "https://%(proxy)s" % {'proxy': proxy}
        # 用户名密码认证
        username = <你的用户名>
        password= <你的密码>
        request.headers['Proxy-Authorization'] = basic_auth_header(username, password)  # 白名单认证可注释此行
        request.headers['Accept-Encoding']='gzip'
        return None

请问下这个
basic_auth_header,是在哪里定义的

@Ttttzc
Copy link

Ttttzc commented Mar 1, 2023

隧道代理
请问现在隧道代理还适用吗?

@rebootcat
Copy link

rebootcat commented Mar 1, 2023 via email

@Huangliming0205
Copy link

cookie被封有什么好的解决办法吗

@nghuyong
Copy link
Owner

换个cookie~

@ljw0602
Copy link

ljw0602 commented May 14, 2024

请问现在怎么使用代理呢?

@pyvadev
Copy link
Contributor

pyvadev commented May 15, 2024

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests