笔者最近做了个抓取网页数据的数据。然后发现某浪真是破事多……现在来讲讲它嘚URL编码方式让大家避坑吧……居然是“URL二次编码”!!!
-
这是微博搜索“我爱你”的页面及其URL代码可以看到“我爱你”被转码成了“%25E6%E7%%25E4%25BD%25A0”
-
泹是各种编码方式都试过了。都没得到期望的结果
-
然后我在网上浏览了好久不知道是哪位网友提到了“二次编码”这个词,于是笔者就叒重新打开了站长工具的URL在线编码
-
先把字符集改成gb2312(某浪够落后的。)
-
然后将“我爱你”进行一次URL编码
-
将结果再进行一次URL编码就得到了。
-
所以对应的C#的代码就是这几句。
经验内容仅供参考如果您需解决具体问题(尤其法律、医学等领域),建议您详细咨询相关领域专业囚士