作者:matrix
发布时间:2013-12-04
分类:兼容并蓄 零零星星
测试地址:
采用最新的本人无数据库缓存10min,绝对不靠谱,仅供测试!
警告:以下内容属于充字数类型且杂乱无章,需要外链功能的请戳上面的地址~
上个月,百度网添加了验证码功能导致以前抓取外链的方法都失效。度娘终于爆发了~
刚开始还没注意到验证码的存在,只要一连几次下载文件就会出现验证码窗口
经过N次的文件下载,看到了度娘的脾气。
也就只允许你前3次下载免验证码,后面你要下载的话那就只有手动输入了。
抓到某个下载地址:
http://small.cdn.baidupcs.com/file/2c808f328bec8fa44d5ac5e2e42985d2?xcode=e0ad680ebd95ea801d4878451d04d36328f07d27337bcbfd0b2977702d3e6764
&fid=1178024267-250528-2238604782
&time=1386087754
&sign=FDTAXER-DCb740ccc5511e5e8fedcff06b081203-w%2FMs%2B2m13ixmrRpD2s11F01H6b4%3D
&to=sc
&fm=Q,B,U,nc
&expires=1386088354
&rt=sh
&r=860261331
&logid=2869754983&sh=1&vuk=3238236832
&fn=文件名
上面的fid、time、sign还能从页面处找到,有些参数根本就看不到。
time和expires参数都是unix时间戳,后者的意思是过期时间。时间相差600秒,也就10分钟。
在这10分钟之内这个地址都是有效的, 😉 那就有点头绪了。
抓取页面的必备参数,获取下载地址,再用session会话缓存那个下载地址,10分钟内有效或者再自动检测。
最爽的是第一次弄免数据库缓存,庆幸书上有session会话的相关章节 哈哈。
再手动下载几次就抓到了获取下载地址的URL:
http://pan.baidu.com/share/download?bdstoken=null&uk=&shareid=&fid_list=[]&sign=×tamp=
看到那几个参数,笑了~
之后就是好几天的编写、测试下载,期间有看书整了个最基本的类 。 额 面向对象 。
源码就暂时为空。
提醒的是度娘这回要检测referer,跟360云盘一样的只能外链下载无法外链播放。自己试试就晓得~
所以我把link.hhtjim.com页面的那个下载按钮去掉了 ,TMD浏览器发送当前URl的referer是没法改的。无语啊~
先放个测试期间最早版本的cookies缓存源码:
<?php
error_reporting(0);//禁用错误报告
function curl_get($url,$post=false,$carry_header=true,$REFERER_=false,$useragent=false,$add_arry_header=null){
$ch=curl_init($url);
if($carry_header){
curl_setopt($ch, CURLOPT_HTTPHEADER, array('User-Agent:Mozilla/5.0 (iPhone; U; CPU iPhone OS 3_1_2 like Mac OS X; en-us) AppleWebKit/528.18 (KHTML, like Gecko) Version/4.0 Mobile/7D11 Safari/528.16'));
}
if($add_arry_header){
curl_setopt($ch, CURLOPT_HTTPHEADER, $add_arry_header);
}
if ($post) {
curl_setopt($ch, CURLOPT_POSTFIELDS, $post);
}
if($REFERER_){
curl_setopt($ch, CURLOPT_REFERER,$REFERER_);
}
if($useragent){
curl_setopt($ch, CURLOPT_USERAGENT, $useragent);
}
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$get_url = curl_exec($ch);
curl_close($ch);
return $get_url;
}
preg_match('|u=(.*)|',$_SERVER["REQUEST_URI"],$bai_res);
$bai_=curl_get($bai_res[1]);
preg_match('|shareid=\"(\d+)\"\?\"\1\":\"\";FileUtils\.uk=\"(\d+)\"\?\"\2\"|',$bai_, $ui);
preg_match('|fs_id\D+(\d+)\D+app_id|',$bai_,$fid);
preg_match('|timestamp=\"(\d+)\"|',$bai_,$time);
preg_match('|downloadsign=\"(\w+)\"|',$bai_,$login);
$diz="http://pan.baidu.com/share/download?bdstoken=null&uk=$ui[2]&shareid=$ui[1]&fid_list=[$fid[1]]&sign=$login[1]×tamp=$time[1]&bdstoken=null&channel=chunlei&clienttype=0&web=1";
$header[]= 'Cookie: BAIDUID=*****'; //请使用自个儿的百度ID,度娘会检查这个的cookies
if(isset($_COOKIE["du$ui[2]-$ui[1]"])){
//header( "Location: $_COOKIE["du$ui[2]-$ui[1]"]");
echo $_COOKIE["du$ui[2]-$ui[1]"];
}else{
$dl=curl_get($diz,null,$header,$bai_res[1],null,$header);
$obj=json_decode($dl,true);
if($obj['errno']!='0'){
//header( "Location: $bai_res[1]");
echo $bai_res[1];
}
setcookie("du$ui[2]-$ui[1]",$obj['dlink'],time()+3600*24);
//header( "Location: $obj['dlink']");
echo $obj['dlink'];
}
?>
这个能不能用就靠你怎么使了,仅是原理。
如果你即刻需要外链,请到http://link.hhtjim.com玩玩~
祝你好运!
博客也快一个月都没有更新了,不码点字不好~
作者:matrix
发布时间:2013-11-03
分类:零零星星
TIME: 20190120 工作几年回过头来发现最近真理这篇post都是17年4月份了。看来工作之后真是进步或许没时间亦或变懒,不为简单函数做笔记。
大多都外链工具所用到的,整理整理,以便后用。
使用@符号也可以
preg_match_all ("/share_uk=(.*?)share/",$ukidConnect,$ukidList, PREG_PATTERN_ORDER);
//使用preg_match_all正则匹配数据并保存到$titleList数组中
$ukidList[0][1]表示第1数组【第一个括弧的值,如.*?】匹配到的字符串
如果preg_match_all换成preg_match,$ukidList[1]也表示第1数组【第一个括弧的值,如.*?】匹配到的字符串
废弃的eregi函数同理,传说使用preg函数更高效
strstr() 函数搜索一个字符串在另一个字符串中的第一次出现。
strpos() 返回字符串在另一个字符串中第一次出现的位置。
strpos 区别大小写strpos查找成功后则是返回的是位置。因为位置有可能是0,所以判断查找失败使用===false更合适。
$zhuaqian=strpos($titleList[0][0],"title>");
$zhuahou=strpos($titleList[0][0],"_免费高速下载|百度云 网盘-分享无限制");
$xinzhi=substr($titleList[0][0],6,$zhuahou-6); //取适当的两个位置中间的值也就是文件名
$_SERVER["REQUEST_URI"]; php自带的函数
取得当前url的页面url。
http://127.0.0.1/xxx.php?st=http://hhtjim.com
返回:/xxx.php?st=http://hhtjim.com
$NOWstr = 'http://' .$_SERVER['HTTP_HOST'].$_SERVER["REQUEST_URI"];//由于$_GET['url']取url不完整
$NEWstr=explode('?url=',$NOWstr);
$quurl = $NEWstr[1];
作用大大的有。
示例代码:
function curl_get($url,$post=false,$carry_ua=true){
$ch=curl_init($url);
if($carry_ua){
curl_setopt($ch, CURLOPT_HTTPHEADER, array('User-Agent:Mozilla/5.0 (iPhone; U; CPU iPhone OS 3_1_2 like Mac OS X; en-us) AppleWebKit/528.18 (KHTML, like Gecko) Version/4.0 Mobile/7D11 Safari/528.16'));
}
if ($post) {
curl_setopt($ch, CURLOPT_POSTFIELDS, $post);
}
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
$get_url = curl_exec($ch);
curl_close($ch);
return $get_url;
}
不懂,再保留另外的
$curlPost=’http://songtaste.com/time.php’;
$ch = curl_init();//初始化curl
curl_setopt($ch,CURLOPT_URL, $url);//提交到指定网页
curl_setopt($ch, CURLOPT_HEADER, 0);//设置header
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);//要求结果为字符串且输出到屏幕上
curl_setopt($ch, CURLOPT_POST, 1);//post提交方式
curl_setopt($ch, CURLOPT_POSTFIELDS, $curlPost);
$data = curl_exec($ch);//运行curl
curl_close($ch);
print_r($data);//输出结果
模拟POST提交数据
$post_data = array('nid' => '13714766852756201', 'shorturl' => 'QeEWZNzPansuQ');
$url='http://ajy8hpcasy.l17.yunpan.cn/share/downloadfile/';
$_REFERER='http://ajy8hpcasy.l17.yunpan.cn/lk/QeEWZNzPansuQ';
$ch = curl_init();
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_POSTFIELDS, $post_data);
curl_setopt($ch, CURLOPT_REFERER,$_REFERER);
ob_start();
curl_exec($ch);
$result = ob_get_contents() ;
ob_end_clean();
echo $result;
set_time_limit(0);//为0时:允许脚本运行的时间无上限。不设置此函数的话默认为30s
header("location: http://hhtjim.com");//跳转到http://hhtjim.com
list() 函数用数组中的元素为一组变量赋值。实际上是一种语言结构,不是函数。
list($shareid, $uk) = array_slice($res, 1, 2);
//数组中有shareid, uk元素,让元素名最为变量名字。
//$res为总的数组,1为规定取出元素的开始位置。2为需要返回的数组数量。
define("GREETING","Hello world!");
//常量名为GREETING,值为"Hello world!
条件表达式e1?e2:e3,若e1为真(非0),则此表达式的值为e2的值;若为假,则表达式的值为e3
例如:
preg_match('|Location: (.+)\r|', $src, $res);
$songurl = $res ? $res[1] : exit(" error!");
示例:
$rt='{"errno":0,"errmsg":"\u64cd\u4f5c\u6210\u529f","data":{"downloadurl":"http:\/\/wsdl25.yunpan.cn\/share.php?method=Share.download&fhash=119f736a936d62396d7dd71ff8fb7d187d69d3d9&xqid=23620387&fname=%E8%AF%B4%E6%98%8E.doc&fsize=211968&nid=13754589643979953&cqid=157ddad976b9aa811591ed43134891f7&st=48ea3770079bce5360f952cff1dc9d29&e=1382784599&dt=25.1291649b2f9ed61380291c5c0d711ca9","params":[]}}';
$obj = json_decode($rt);
$dll=$obj->data->downloadurl;
echo $dll;
结果显示:http://wsdl25.yunpan.cn/share.php?method=Share.download&fhash=119f736a936d62396d7dd71ff8fb7d187d69d3d9&xqid=23620387&fname=%E8%AF%B4%E6%98%8E.doc&fsize=211968&nid=13754589643979953&cqid=157ddad976b9aa811591ed43134891f7&st=48ea3770079bce5360f952cff1dc9d29&e=1382784599&dt=25.1291649b2f9ed61380291c5c0d711ca9
示例二:
json数据:
{
"songs": [{
"score": 100,
"copyrightId": 0,
"mvid": 0,
"mp3Url": "http://m1.music.126.net/fG44YGce-id8VZ9LjQIPpQ==/1069824813834035.mp3"
}],
"code": 200
}
php处理:
$eo='上面的json数据';
$obj=json_decode($eo,true);
echo $obj['songs'][0]['mp3Url'];
结果返回:
h t t p : / /m1.music.126.net/fG44YGce-id8VZ9LjQIPpQ==/1069824813834035.mp3
$b = &$a; //变量前& 表示$b 和 $a 引用了同一个变量
extract() 函数 把数组中的键名设置为变量,其键值为变量的值。
对于数组中的每个元素,键名用于变量名,键值用于变量值。
substr_replace($P,$v,9,1);//(替换第10位的数字为$p)
<<< 运算符,将由自定义分界符间的内容视为字符串,可对其间的变量做处理
echo <<<tem
<script>alert("输入的留言内容太长!");history.go(-1);</script>
tem;
tem是任意字符,<<<后的tem标记着开始。必须以 tem; 结尾,另起一行顶格(前面无空格)书写,否则会报错。
echo <<<'tem'
$a str
tem;
添加单引号 就不会解析里面的变量
urlencode()返回字符串,此字符串中除了 -_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数.
rawurlencode()功能和urlencode基本一样,采用的是RFC1738编码,因此空格会编码为%20
sprintf() 函数把格式化的字符串写入一个变量中。
array_search()函数在数组中查找一个键值。如果找到了该值,匹配元素的键名会被返回。
函数计算字符串的 MD5 散列,第二的参数规定十六进制或二进制输出格式。
PHP_EOL表示换行符
split()用正则表达式将字符串分割到数组中
mt_rand(A,B) 函数返回A到B的随机整数
创建一个包含变量名和它们的值的数组:
$firstname = "Bill";
$lastname = "Gates";
$age = "60";
$result = compact("firstname", "lastname", "age");
print_r($result);
extract() 正好相反
陆续添加整理。。。
作者:matrix
发布时间:2013-10-26
分类:零零星星
demo:http://link.hhtjim.com
外链测试:
http://music.sina.com.cn/yueku/i/2850351.html 阅读剩余部分 »
作者:matrix
发布时间:2013-10-26
分类:兼容并蓄 零零星星
微云网盘的10TB空间也要全部利用起来。
申明:此页面的源码已失效,走这里查看最新>>微云网盘php解析源码_更新
代码来自破博客
<?php
//提取微云分享地址
preg_match('|\/.+\/(\w+)|', $_SERVER['REQUEST_URI'], $res);
$key = $res ? $res[1] : exit("weiyun URL error!");
$url = $referer = "http://share.weiyun.com/$key";
$useragent = "BlackBerry/3.6.0";
//匹配出下载地址
$curl = curl_init($url);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($curl, CURLOPT_USERAGENT, $useragent);
curl_setopt($curl, CURLOPT_TIMEOUT, 10);
$src = curl_exec($curl);
curl_close($curl);
preg_match('|http://.+sharekey[^"]+|', $src, $res);
$url = $res ? $res[0] : exit("weiyun URL error! Not find weiyun code!");
//伪造referer,获取返回的响应头信息
$curl = curl_init($url);
curl_setopt($curl, CURLOPT_HEADER, 1);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($curl, CURLOPT_REFERER, $referer);
curl_setopt($curl, CURLOPT_USERAGENT, $useragent);
curl_setopt($curl, CURLOPT_TIMEOUT, 10);
$src = curl_exec($curl);
curl_close($curl);
//从响应信息头匹配出真实的文件地址并下载
preg_match('|Location: (.+)\r|', $src, $res);
$songurl = $res ? $res[1] : exit("Can not get WeiYun Download url!");
header("Location: $songurl");
//echo $songurl;
?>
这种方法该不错滴。
使用示例:http://XXX.php/微云URL
http://share.weiyun.com/b500a423288e8d0095d49657fe21438b 阅读剩余部分 »
作者:matrix
发布时间:2013-10-19
分类:兼容并蓄 零零星星
用火狐的firebug插件看到云盘的下载过程是通过post提交获得json数据(期间会检查REFERER),之后再跳转到下载地址。
图片外链演示:
mp3外链失败,但是下载的话没问题(后来才知道是360防盗链的Referer缘故):
作者:matrix
发布时间:2013-10-14
分类:兼容并蓄 零零星星
说明:
外链转换没有永久的,请酌情使用!!
链接地址可自动识别并相应的简单处理,有的显示文件名以及后缀。
链接地址可不用输入HTTP://,如果没有HTTP://会自动添加在链接开头位置。
将就各种奇葩,自动去掉空格,URL后面的/,有些还有报错提示。
支持的链接格式:
百度网盘:
http://pan.baidu.com/s/13isoZ
http://pan.baidu.com/share/link?shareid=3760603697&uk=3238236832
虾米音乐:
http://www.xiami.com/song/1772222342
http://www.xiami.com/song/33112?spm=a1z1s.3521865.23309997.2.RAsL1F
http://www.xiami.com/song/play?ids=/song/playlist/id/1772222342/object_name/default/object_id/0
程序的死的,如果没有得到那个ID它会开小差,所以建议你手动获取id,其他相同外链同理
转换后的直链地址形如:
http://link.hhtjim.com/xiami/音乐ID.mp3
Songtaste音乐:
http://www.songtaste.com/song/262121
http://songtaste.com/song/262121
一听音乐:
http://www.1ting.com/player/f4/player_944464.html
新浪微盘:
http://vdisk.weibo.com/s/zb_f-vRa57H7-
金山快盘:
http://www.kuaipan.cn/file/id_9732344353166091.htm
360云盘:
http://ajvvqzy2v8.l29.yunpan.cn/lk/QXJ786DeBjeiW
http://yunpan.cn/QXJ786DeBjeiW
......
想着把这个web app放到bae上速度会很快,但bae伪静态跟普通空间的.htaccess文件设置伪静态不同
需要在BAE的根目录新建app.conf文件,添加相应的伪静态规则。
BAE:
handlers:
- expire : .jpg modify 10 years
- expire : .swf modify 10 years
- expire : .png modify 10 years
- expire : .gif modify 10 years
- expire : .JPG modify 10 years
- expire : .ico modify 10 years
- url : /bdwl/((.*)/(.*)/.*\..*
script : /d.php?/$1/$2
- url : /xiami/(.*)\.mp3
script : /wailian.php?xiaurl=http://www.xiami.com/song/$1
- url : /st/(.*)\.mp3
script : /wailian.php?sturl=http://songtaste.com/song/$1
- url : /yt/(.*)/(.*)\.wma
script : /wailian.php?yt=http://www.1ting.com/player/$1/player_$2.html
- url : /vp/(.*)/.*\..*
script : /wailian.php?vp=http://vdisk.weibo.com/s/$1
- url : /jins/(.*)/.*\..*
script : /wailian.php?jins=http://www.kuaipan.cn/file/id_$1.htm
比较.htaccess文件:
RewriteRule ^bdwl/([0-9]+)/([0-9]+)/([\s\S]+)\.([a-zA-Z0-9]+)?$ /d.php/$1/$2 [L]
RewriteRule ^xiami/([0-9]+)\.mp3?$ /wailian.php?xiaurl=http://www.xiami.com/song/$1 [L]
RewriteRule ^st/([0-9]+)\.mp3?$ /wailian.php?sturl=http://songtaste.com/song/$1 [L]
RewriteRule ^yt/(\w+)/([0-9]+)\.wma?$ /wailian.php?yt=http://www.1ting.com/player/$1/player_$2.html [L]
RewriteRule ^vp/([\w-]+)/([\s\S]+)\.([a-zA-Z0-9]+)?$ /wailian.php?vp=http://vdisk.weibo.com/s/$1 [L]
RewriteRule ^jins/(\d+)/([\s\S]+)\.([a-zA-Z0-9]+)?$ /wailian.php?jins=http://www.kuaipan.cn/file/id_$1.htm [L]
这个小工具其实早就在国庆期间弄出来了,一直都是出于自用阶段。博客的空间也换了,完全没有以前天翼云vps 的高响应速度,就一直拖着。
这才整理之前的外链转换工具:虾米、songtaste、百度网盘,还添加金山快盘、一听音乐的php外链。此工具代码参考于度娘或者谷歌,部分来自ifoouu.com。感谢分享!
作者:matrix
发布时间:2013-09-24
分类:兼容并蓄
SongTaste已经不复存在~
转换地址: http://link.hhtjim.com
songtaste.com的音乐打开速度是比较快的,比起百度网盘就songtaste和xiaomi的速度很理想,外链起来比较不错。
网上找了很多SongTaste外链的方法,大多数都是pc端程序,没看到什么php源码之类的东西,很是蛋疼。 阅读剩余部分 »
作者:matrix
发布时间:2013-09-07
分类:兼容并蓄 零零星星
添加自动识别百度外链的文件名以及后缀 中抓取页面标题的方式有点落后,这次稍微修改,使用关于正则匹配的函数。
相关代码:
$fp = file_get_contents($quurlXX);//$quurlXX为百度网盘地址
preg_match_all ("/title\>.*\<\/title/",$fp,$titleList, PREG_PATTERN_ORDER);//使用preg_match_all正则匹配数据并保存到$titleList数组中
//echo $titleList[0][0] ;
$zhuaqian=strpos($titleList[0][0],"title>");
$zhuahou=strpos($titleList[0][0],"_免费高速下载|百度云 网盘-分享无限制");
$xinzhi=substr($titleList[0][0],6,$zhuahou-6); //取适当的两个位置中间的值也就是文件名
$zz = 'http://www.hhtjim.com/bdwl/'.$urlcode.'/'.$uk.'/'.$xinzhi;
echo $zz;
这次抓取的话相对于以前要好些了,除非度娘又把文件名后面的那一串串“_免费高速下载|百度云 网盘-分享无限制”给改了,要不我这又失效了。
bapi.php下载:
http://www.400gb.com/file/29243856
http://pan.baidu.com/share/link?shareid=1490940073&uk=3238236832
这次又调整 外链程序到v0.3。之前用的奶酪博客首发解析百度网盘 V3.1 直链下载 ,后来发现 破博客 的 百度网盘音乐外链源码 更简单实用。
更新提取百度网盘下载链接:
if(isset($_GET['baiu'])){
$baiduURL=explode("?baiu=",$_SERVER["REQUEST_URI"]);//取?baiu=后面的百度网盘链接地址
$bai_url = $baiduURL[1];
$bai_src = file_get_contents($bai_url);
preg_match('|MusicPlayer\("(.*)"|U', $bai_src, $bai_res);//匹配源码里面的下载地址并跳转
$bai_songurl = $bai_res[1];
preg_match('|dlink\\\":\\\"(.*)\\\"|U', $bai_src, $bai_res);
$bai_songurl = str_replace("\\\\", "", $bai_res[1]);
header("location:$bai_songurl");
}
说明:相关代码来自破博客的 百度网盘音乐外链源码 。
将上面代码保存到php文件中,执行示例:/*.php?baiu=百度网盘分享地址(支持新老版本)
- 1
- 2
- 3