用 JAVA 判断一个URL是否有效

  最近因项目需求,需要针对一些URL地址进行检测是否可用,刚开始考滤的是用InputStream 以流的形式来实现,读取网页的<title></title>元素做出判断,但这种方式试了几次就没有再考滤使用,因通过这种方式检测网页的 title 可能会有几种形式出现,比如大小写问题,那这样写代码就要进行多一些的判断,这个不行就判断下一个,但这样不但会消耗系统资源,而且更脑火的是有时检测不出来一个URL是否可连接,因为有些网页连接后失败有可能会转发到另一个网页, 后来就考滤用 java.net 下的类来实现,说实在的 java.net 下的类我还从来没用过,以前开发项目也没搞过这一块,所以就研究了一下,在网上也找了一些资料,都没找到相关的处理方式,所以这个文章就产生了,我们用到了 URL和HttpURLConnection 二个类 ,URL 是统一资源标识符的引用,一个URL实例代表着一个url的引用, HttpURLConnection : 通常一个HttpURLConnection 的实例可以生成一个请求,它有个方法 getResponseCode();可以得到请求的响应状态,该方法返回一个 int 分别是 200 and 404 如无法从响应中识别任何代码则返回 -1,现在就让我们来实现一下吧! 请看代码清单一:                                                                                                                                    字串5

   清单一: URLAvailability.java

 package com.xxxxxxxxxxxxxxxxxxxxx;
import java.net.HttpURLConnection;
import java.net.URL;

字串7

import org.apache.log4j.Logger; 字串8

/**
 *
 *
 * 文件名称为:URLAvailability.java
 *
 * 文件功能简述: 描述一个URL或图片地址是否有效
 *
 * @author ChenTao
 * @version
 * @time 2008-5-29 上午10:00:35
 * @copyright  */
@SuppressWarnings("unused")
public class URLAvailability {

字串2

 private static Logger logger = Logger.getLogger(URLAvailability.class);

字串4

 private static URL urlStr;

字串5

 private static HttpURLConnection connection;

字串5

 private static int state = -1; 字串8

 private static String succ; 字串2

 /**
  * 功能描述 : 检测当前URL是否可连接或是否有效,
  * 最多连接网络 5 次, 如果 5 次都不成功说明该地址不存在或视为无效地址.
  *
  * @param url
  *            指定URL网络地址
  *
  * @return String
  */
 private synchronized String isConnect(String url) {
  int counts = 0;
  succ = null;                  if (url == null || url.length() <= 0) {                        return succ;                  }
  while (counts < 5) {
   try {
    urlStr = new URL(this.getUrl());
    connection = (HttpURLConnection) urlStr.openConnection(); 字串8
    state = connection.getResponseCode();
    if (state == 200) {
     succ = connection.getURL().toString();
    }
    break;
   } catch (Exception ex) {
    counts++; logger.info("loop :" + counts);
    continue;
   }
  }
                   return succ;
 }
}
  字串9


   问题解决了,循环是因为怕网络连接状态忙,第一次可能连接不上,但很少,一千个地址有可能只有那么一二个,大家可能看到该方法实现了同步,这个必须要加,要不能会造成多线程问题,后果就不说了。
字串9

作者: 武汉北大青鸟
原载: 武汉北大青鸟鲁广校区 whhpaccp.com
版权所有,转载时必须以链接形式注明作者和原始出处及本声明
高中生入口-武汉北大青鸟
大学生入口-武汉北大青鸟
三校生入口-武汉北大青鸟
去名企入口-武汉北大青鸟

开班时间-武汉北大青鸟

武汉北大青鸟报名咨询
企业人才预定热线
全国免费咨询电话
就业服务电话
教学质量监督
武汉北大青鸟地址
邮编
027-87807737 / 87807787
027-87807736
800-880-0456(电信用户)
027-87807717 李老师
027-87807727 吕老师
武汉洪山区鲁巷广场武汉数码港3楼(鲁巷广场隔壁)
430074  鄂ICP备06014222号