Html5大文件断点续传实现方法

发布时间 2023-10-13 11:49:29作者: Xproer-松鼠
大文件分块

一般常用的web服务器都有对向服务器端提交数据有大小限制。超越一定大小文件服务器端将返回拒绝信息。当然,web服务器都提供了配置文件可能修改限制的大小。针对ii实现大文件的上传网上也有一些通过修改web服务器限制文件大小来实现。不过这样对web服务器的平安带了问题。攻击者很容易发一个大数据包,将你web服务器直接给拖死。
现在针对大文件上传主流的实现方式,通过将大文件分块。比方针对一个100M文件,按2M拆分为50块。然后再将每块文件依次上传到服务器上,上传完成后再在服务器上合并文件。
web实现大文件上传,核心主要实现文件的分块。Html5FileAPI呈现以前,要想在web上实现文件分块传输。只有通过flash或Activex实现文件的分块。

Html5下,可以直接通过fileslice方法来实现文件的分块。如:

<pclass="codetext"><pclass="codehead"><spanclass="lantxt">XML/HTMLCode<spanonclick="copyidtextcode_6864"class="copycodetext"style="cursor:pointer">复制内容到剪贴板

 

<pid="code_6864"><olclass="dp-xml"><liclass="alt">file.slic0,1000;
  • file.slic1000,2000;
<liclass="alt">file.slic2000,3000;

 

 

然后再通过XMLHttpRequest异步上传到服务器。

Html5上传文件类库

如果你有兴趣及时间 当然可以自己用html5FileAPI来实现。自己在网上查找到以下两个支持html5类库。
resumable.j附git上的地址:https://github.com/23/resumable.j
Pludloadhttp://plupload.com/

resum一个纯html5上传类库。
而Pludload一个支持html5,flash,silverlight,html4,会自动判断浏览是否支持html5不支持将用其它上传方式。
测试下来,resum和Pludload都支持html5分块上传文件。用下来觉得resum比拟适合,以下就选resum来进行介绍。

resumable.j断点上传使用介绍

主要配置介绍:
<pclass="codetext"><pclass="codehead"><spanclass="lantxt">JavascriptCode<spanonclick="copyidtextcode_1658"class="copycodetext"style="cursor:pointer">复制内容到剪贴板

 

<pid="code_1658"><olclass="dp-c"><liclass="alt"><spanclass="keyword">varr=<spanclass="keyword">newResum{
  • target:<spanclass="string">/test/upload,
<liclass="alt">chunkSize:1*1024*1024,
  • simultaneousUploads:4,
<liclass="alt">testChunks:<spanclass="keyword">true,
  • throttleProgressCallbacks:1,
<liclass="alt">method:<spanclass="string">"octet"
  • };

 

 

chunkSiz分块文件大小,以字节为单位
simultaneousUpload同时上传文件块的进程数,可以同时允许多个文件块上传。
testChunk上前文件块是否先通过get方式发送文件信息检测文件是否已经上传。

resum断点上传是通过testChunk配置节点来实现,当设置为true时。resum会先发送一个get请求,如果http状态返回 200则认为当前块已经上传完成,然后进行下一块的get请求。如果http状态返回的不是200则将通过post方式发送当前块数据包进行文件块上传。

设置testChunk为true每次上传都会增加一个get请求,如果我已经知道上次中断上传前文件的块数。下次直接从中断的块数上传就行了这样可以为每个块减少一次httpget请求。
针对这个需求,修改了resum源码,为resum里的file对象增加了一个startchunkindex属性,默认为0用于设置当前文件从哪一个块开始上传。这样,只需要在文件上传前从服务器上进行一次查询(查询当前文件上传到哪一块)返回上次上传的文件块索引。再将索引值设置到filestartchunkindex属性就可以实现从上次断开的文件块开始上传。
调用方式:

<pclass="codetext"><pclass="codehead"><spanclass="lantxt">JavascriptCode<spanonclick="copyidtextcode_8252"class="copycodetext"style="cursor:pointer">复制内容到剪贴板

 

<pid="code_8252"><olclass="dp-c"><liclass="alt"><spanclass="comment">//Handlfileaddevent
  • r.on<spanclass="string">fileA dded,<spanclass="keyword">functionfile{
<liclass="alt">file.startchunkindex=0;<spanclass="comment">//设置当前文件开始上传的块数

 

 

具体可以检查附件里的demo

收尾工作

所有文件块上传完,最后工作就是合并保管文件。附件为resum断上传.net实现的服务端例子,包括简单的文件合并功能。其它语言的demo大家也可以从resumgit上下载。
demo例子为了简单,只是把文件存放在本机。真实的生产环境中。一般应该放在单独的文件服务器上(前台web通过ftp或文件夹共享方式上传到文件服务器)然后对上传好的文件进行分发镜像或处理(比方视频压缩)当然最好是存在分布式文件系统中,目前看下来放到Hadoop分布式文件系统(HDFS一个不错的好方案。

 

参考文章:http://blog.ncmem.com/wordpress/2023/10/13/html5%e5%a4%a7%e6%96%87%e4%bb%b6%e6%96%ad%e7%82%b9%e7%bb%ad%e4%bc%a0%e5%ae%9e%e7%8e%b0%e6%96%b9%e6%b3%95-2/

欢迎入群一起讨论