从文本或HTML源码中解析并提取有效的URL链接地址,支持多种协议。
输入文本开始提取
当您需要从大段文本或HTML代码中手动筛选URL时,既耗时又容易遗漏。URL提取器通过正则表达式和语法分析,自动识别文本中符合RFC标准的统一资源定位符(URL),输出所有有效的链接地址列表,包括http、https、ftp、mailto等协议类型。
问:URL提取器能处理多大文本?
答:建议文本长度在10万字符以内,超长文本可能响应延迟,可分段处理。
问:能否提取JavaScript动态生成的链接?
答:不能。本工具基于静态文本解析,仅处理输入文本中明文字符串,不执行JS代码。
仅支持文本格式输入,不支持二进制文件。工具会过滤语法无效的链接,但对链接是否可达不做验证。处理隐私文本时请注意,本工具为前端本地解析,无数据上传风险。
对于正则表达式高级用户,可结合提取结果进行二次过滤。例如从博客HTML中提取所有https文章链接后,可用正则'/blog/.+'进一步筛选专栏内容。典型输入输出示例:输入'官网https://tool.com,联系mailto:help@tool.com',输出为两行独立URL:https://tool.com 和 mailto:help@tool.com。