티스토리 뷰

Development/Java

[Java] HTML 태그(Tag) 삭제하기

Mir(whdghks913) 2014.02.15 11:30

HTML을 파싱하고난후 결과를 받아보면 HTML의 태그가 존재하는 경우가 간혹 있습니다


<p>안녕하세요<img>~</img></p>


여기서 "안녕하세요"만 얻고 싶은대 <img>까지 같이 오는 경우 아래 메소드로 HTML 태그 삭제가 가능합니다


public String RemoveHTMLTag(String changeStr){
    if(changeStr != null && !changeStr.equals("")){
        changeStr = changeStr.replaceAll("<(/)?([a-zA-Z]*)(\\s[a-zA-Z]*=[^>]*)?(\\s)*(/)?>", "");
    }else{
        changeStr = "";
    }
    return changeStr;
}
저작자 표시 비영리 변경 금지
신고
크리에이티브 커먼즈 라이선스
Creative Commons License
댓글
댓글쓰기 폼