[XML] DOM

2008.01.03 17:19

DOM

DOM(Document Object Model)

  • W3C's definition

    "The Document Object Model is a platform- and language-neutral interface that will allow programs and scripts to dynamically access and update the content, structure and style of documents.

  • DOM 의 역할
    • dynamic access and update
      • XML/HTML 문서의 접근 및 수정 => 내용/구조/스타일 정보의 검색 및 수정
      • 대상 문서 : XML1.0 또는 HTML4.0, 기타 웹문서
      • 컨텐츠의 조작 : 문서 요소에서 text 등 컨텐츠의 검색/질의, 추가/수정/삭제
      • 구조의 탐색 및 조작 : 각 요소와 속성에 대한 검색/질의, 추가/수정/삭제
    • interface
      • 응용 프로그램 인터페이스 (API) - 각종 메소드 및 속성을 정의
      • 플랫폼 및 언어 중립적(스크립트 포함) : Java, JavaScript, ASP, ...
  • DOM level
    • DOM level 1 : 1998.10 W3C 표준안
    • DOM level 2 : 2000.11 W3C 표준안
    • DOM level 3 : 2001.8 W3C Working Draft

DOM and XML Parser

  • Parser 의 역할
    • XML 문서를 읽고 해석 : well-formed, valid 검사
    • 응용프로그램 개발시 파서 사용 이유
      • 파서가 메모리에 DOM 트리를 생성 : XML 문서트리와 일치
      • 세부적인 XML 문법으로부터 프로그램 격리

  • [참고] SAX 기반 Parser

DOM 구조적 모델

  • DOM 트리에서 노드/객체의 종류
    • Document : 문서 객체, 최상위 노드
    • Element, Attribute : 문서의 구조를 구성하고 있는 요소
    • Text : 컨텐츠의 내용, 항상 단말 노드
    • Collection : 일종의 노드 집합
  • DOM 트리의 예

    <parent>
        <child  id="123">text here</child>
     </parent>

     

  • 인터페이스(API)의 예
    • 객체의 속성과 메소드를 사용하기 위한 사양
    • DOM 인터페이스 예
      - 문서.childNodes[1].nodeName
      - 문서.firstChild.firstCild.firstCild.nodeName
      - 문서.firstChild.firstCild.firstCild.nodeValue
  • DOM Core Interface (Object Hierachy) 교재 p.414 (표9-3)

DOM 주요 API

  • DOM 인터페이스의 공통 속성
    • type, name, value
    • 예) Node 객체의 경우 nodeType, nodeName, nodeValue 속성
      • nodeType은 위 그림과 같이 여러 가지가 있다 (p.418 표 9-6, 9-7)
  • 주요 객체/속성/메소드 - 진행하면서 지속적으로 참조

    객체(Object)

    속성(Properties)

    메소드(methods) 

    Node 객체

    nodeName, nodeType, nodeValue, childNodes, parentNode, childNode, firstChild, lastChild, previousSibling, nextSibling, attributes, ownerDocument, ..., 
    (
    text, xml) [표9-8]

    [표9-10] 노드 정보 구하기
    getNodeName, ..., getAttributes, ...
    [표 9-11] 문서 조작
    appendChild, insertBefore,
    removeChild, replaceChild, cloneNode
    [표 9-12] 트리 순회 관련
    getParentNode, getChildNode, ...
    hasChildNodes, ...

    Document 객체

    doctype,
    documentElement, implementation, ...

    (async, readyState)
    * W3C 표준이 아니라  MS에서 제공하는 인터페이스

    [표9-13] 문서관련 정보
    egtDoctype, getImplementation, ...
    [표 9-14] 트리 순회 관련
    getDocumentElement, getElemenmtByID,
    getElementByTagName, ...
    [표 9-15] 문서 작성
    createElement, createAttribute, createTextNode, createCDATASection, createComment, createEntityReference, ...

    DOMImplementation 객체

     

    [표 9-16] hasFeature, createDocument, ...

    DocumentFragment 객체

    * Node 객체와 동일

    * Node 객체와 동일

    NodeList 객체

    length

    [표 9-17] getLength, item

    Element 객체

    tagName

    [표 9-18] Element의 속성에 접근
    getAttribute, setAttribute, getAttributeNode, setAttributeNode, removeAttribute, ...,
    [표 9-18]Element 객체에 접근
    getTagName, hasAttribute, ...

    NamedNodeMap 객체

    length

    [표 9-19] getNamedItem, setNamedItem, removeNamedItem, item, getLength

    Attribute 객체

    name, value

    [표 9-20] getName, getValue, setValue, ...

    CharacterData 객체

    data, length

    [표 9-21] appendData, deleteData, insertData, replaceData, substringData, ...

DOM 프로그래밍 시작 - Document 객체

  • 문서 객체 새로 만들기 : DOMDocument 객체를 생성
    • Msxml.DOMDocument 객체를 새로 만들기
    • 또는 HTML에서 <xml> 태그 이용

    JavaScript (JScript)

    <Script language="Javascript">
       
    var xdoc1,xdoc2
       
    xdoc1 = new ActiveXObject("Msxml.DOMDocument");
       
    xdoc2 = new ActiveXObject("Msxml.DOMDocument");
        ...
    xdoc1.load("ex08.xml");  xdoc2.load("ex09.xml");
    </script>
    VBScript 의 경우 <Script language="VbScript">
      Dim xdoc1,xdoc2
      Set xdoc1 = CreateObject("Msxml.DOMDocument")
      Set xdoc2 = CreateObject("Msxml.DOMDocument")
      ...
    xdoc1.load("ex08.xml"); xdoc2.load("ex09.xml");
    </Script>

    HTML에서 <xml>  태그 이용

    - MSXML 파서 설치안한 경우

    <HTML> <HEAD>
        <Script language="Javascript">
            xdoc.load("ex08.xml");    </script>
    </HEAD>
    <BODY>
        <xml id="xdoc1"></xml>
        <xml id="xdoc2" src="ex09.xml"></xml>
    </BODY> </HTML>

    Java의 경우

    import java.xml.parsers.*;
    ...
    class xxxxxx
    {
      public static void main(String[] args) throws Exception
      {
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        DocumentBuilder  db = dbf.newDocumentBuilder();
        Document  xdoc1 = db.parse(new FileInputStream(arg[0]));
    ...

  • 기존의 XML 문서 읽기
    • DOMDocument 객체 읽기 - async 속성, load 메소드, xml 속성 : MSXML에서 제공
    MSXML 파서 설치한 경우   MSXML 파서 설치안한 경우  
    <HTML>
    <HEAD>
    <Script language="Javascript">
    function xload0()
    {
       
    var xdoc = new
            ActiveXObject("Msxml.DOMDocument");
        xdoc.
    async = false;    xdoc.load("ex08.xml");
       
    alert(xdoc.xml);
    }
    </script>
    </HEAD>
    <BODY>
    <input type="button" value="XML 로드0"
        onClick="xload0()">
    </BODY>
    </HTML>  
    <HTML>
    <HEAD>
    <Script language="Javascript">
    function xload1()
    {
        xdoc.async = false;
        xdoc.load("ex08.xml");

         alert(xdoc.xml);
    }
    </script>
    </HEAD>
    <BODY>
    <input type="button" value="XML 로드1"
        onClick="xload1()">
    <xml id="xdoc"></xml>
    </BODY>
    </HTML>
    VBScript 의 경우
    <Script language="VbScript">
      Dim xdoc
      Set xdoc = CreateObject("Msxml.DOMDocument")
      xdoc.
    async = False;
      xdoc.
    load("ex08.xml");  MsgBox  xdoc.xml
    </Script>
  • 신규 XML 문서의 작성
    • loadXML 메소드  
     xdoc.async = false;
     xdoc.
    loadXML( "<book><title>XML 입문</title><author>일지매</author></book>");
     alert(xdoc.xml);  
     xdoc.async = false;
     xdoc.
    loadXML( "<book> <title> XML 입문 </title> <author> 일지매 </author> </book>");
     alert(xdoc.xml);  
  • 공백의 처리 : preserveWhiteSpace 속성
     xdoc.async = false;
     xdoc.preserveWhiteSpace = true;
     xdoc.loadXML( "<book> <title> XML 입문 </title> <author> 일지매 </author> </book>");
     alert(xdoc.xml);  
     xdoc.async = false;
     xdoc.preserveWhiteSpace = true;
     xdoc.load("ex08.xml");
     alert(xdoc.xml);  
  • XML 문서의 저장 : save 메소드
  • 에러 처리 : parseError 객체
    • parseError.errorCode, parseError.line, parseError.linepos, parseError.reason
     xdoc.async = false;
     xdoc.loadXML( "<book> <title> XML 입문 </title> <author> 일지매 </authors> </book>");
     alert(xdoc.xml);  
     xdoc.async = false;
     xdoc.loadXML( "<book> <title> XML 입문 </title> <author> 일지매 </authors> </book>");
     if (xdoc.parseError)
        alert("에러 위치 : " + xdoc.parseError.line + "번째 라인 " + xdoc.parseError.linepos 
                  + "번째 문자 에러 이유 : " + xdoc.parseError.reason);
     else
    alert(xdoc.xml);  
  • 루트 노드 찾기 (루트 에리먼트)
    • documentElement 속성
     xdoc.async = false;
     xdoc.load("ex08.xml");
     var xroot = xdoc.
    documentElement;
     alert(xroot.nodeName);  
     xdoc.async = false;
     xdoc.loadXML( "<book> <title> XML 입문 </title> <author> 일지매 </author> </book>");

     var xroot = xdoc.
    documentElement;
     alert(xroot.nodeName);  

Node 객체의 정보구하기 - Node 객체

  • 속성 : nodeName, nodeType, nodeValue, attributes, text 속성
  • nodeType
    • 1 (element), 2 (attribute), 3 (text) , 4 (CDATA), 5 (Entity Reference)...
  •  xdoc.load("ex08.xml");
     var xroot = xdoc.documentElement;
     alert('nodeName: '+xroot.nodeName+' nodeType: '+xroot.nodeType+
           ' nodeValue: '+xroot.nodeValue+' attributes: '+xroot.attributes.length);
     alert('xroot.text : ' + xroot.text);
     

실습 프로그램

  • 파일 LOAD 및 DOM 명령 실행 (교재 s20-03.htm 과 s20-05.htm 혼합)

    XML 파일 경로를 직접 입력하거나  '찾아보기'로 선택, 'LOAD'로 파일을 메모리에 로드
    경로 :  =>

    또는 미리 작성되어 있는 파일 사용하기  

    사용하고자 하는 DOM 구문을 아래에 입력하고 '확인' 버튼을 클릭  (예 : xdoc.text, xdoc.documentElement.firstChild.nodeName, ...) 구문 :    

     <SCRIPT language="Javascript">
            var xdoc, rootNode;
            function
    FileLoad(filename)
            {
                    xdoc = new ActiveXObject("Msxml.DOMDocument");
                    xdoc.async = false;
                    if (filename) xdoc.load(
    filename);
                    else xdoc.load(
    "file://"+path.value);
                    if (xdoc.parseError.errorCode != 0)
                        alert("파일을 메모리로 로드하는데 실패하였습니다 : " + xdoc.parseError.reason);
     
                    rootNode = xdoc.documentElement;
                    alert("[파일로드 성공] 루트 엘리먼트 : " + rootNode.nodeName);
            }
            function Execute()
            {
                    var selectionString;
                    try {
                            selectionString = eval(syntax.value);
                    } catch(e) {
                            selectionString = null;
                    }
                    alert(selectionString);
            }
    </SCRIPT>  
     ...
    <BODY>
     ... 경로 : <input  type="file"  size="40"  id="
    path">
         <input  type="button"  value="LOAD"  onclick="
    FileLoad()">
     ... 미리 작성되어 있는 파일
         <input  type="button"  value="서점 책 list"  onclick="
    FileLoad("ex08.xml")">
     ... 구문 : <input  size="50"  id="
    syntax"  value="xdoc.">&nbsp;
         <input  type="button" onclick="
    Execute()" value=확인>
     ...
    </BODY>

신고
Posted by 나비 나비:D
태그 DOM, xml

Parser 와 DOM 기초

  • Parser
    • XML 문서를 읽고 해석 : well-formed, valid 검사
    • 응용 개발시 파서 사용 이유 : 세부적인 XML 문법으로부터 프로그램 격리
         XML 문서 --> [파서] -->인터페이스--> [응용 프로그램]
    • 파서가 메모리에 DOM 트리를 생성 : XML 문서트리와 일치
  • 표준 API
    • DOM : 객체 기반 (Object-based) Interface
      - 메모리 상주 트리 이용, 응용에서 간단히 사용, p.208
    • SAX : 이벤트 기반 (Event-driven) Interface
      - 파서가 간단, 응용프로그램은 복잡
  • DOM 개요
    • 문서내 객체(element)를 조작하기 위한 인터페이스(API)
      -
      DOM level 1 : ’98.10 W3C Recommendation
      - DOM level 2 : 2000.11 W3C Recommendation
      - DOM level 3 : 2001.8 W3C Working Draft
    • 문서 전체가 아닌 문서 일부분에 대한 접근 가능
    • 대상 문서 : XML1.0 또는 HTML4.0
  • DOM의 역할
    • 구조의 탐색 : 각 요소와 속성에 대한 탐색/질의가 가능
    • 문서 구조의 조작 : 문서 구조에서 요소, 속성의 추가/수정/삭제가 가능
    • 컨텐츠의 조작 : 문서 요소에서 text 등 컨텐츠의 탐색/추가/수정/삭제가 가능

Document 객체

  • DOMDocument 객체 생성 및 읽기
    • Msxml2.DOMDocument 객체
    • async 속성, load 메쏘드, xml 속성
    MSXML 파서 설치할 경우   MSXML 파서 설치안한 경우  
    <HTML>
    <HEAD>
    <Script language="Javascript">
    function xload0()
    {
        var xmldoc = new
            ActiveXObject("Msxml2.DOMDocument");
        xmldoc.async = false;    xmldoc.load("ex07a.xml");
        alert(xmldoc.xml);
    }
    </script>
    </HEAD>
    <BODY>
    <input type="button" value="XML 로드0"
        onClick="xload0()">
    </BODY>
    </HTML>
     
    111<HTML>
    <HEAD>
    <Script language="Javascript">
    function xload1()
    {
        xmldoc.async = false;
        xmldoc.load("ex07a.xml");

        alert(xmldoc.xml);
    }
    </script>
    </HEAD>
    <BODY>
    <input type="button" value="XML 로드1"
        onClick="xload1()">
    <xml id="xmldoc"></xml>
    </BODY>
    </HTML>
    VBScript 의 경우
    <Script language="VbScript">
      Dim xmldoc
      Set xmldoc = CreateObject("Msxml2.DOMDocument")
      xmldoc.async = False;
      xmldoc.load("ex07a.xml");
      MsgBox xmldoc.xml
    </Script>
  • 신규 문서 작성 : loadXML 메쏘드
     xmldoc.async = false;
     xmldoc.loadXML( "<book><title>XML 입문</title><author>일지매</author></book>");
     alert(xmldoc.xml);
     
     xmldoc.async = false;
     xmldoc.loadXML( "<book> <title> XML 입문 </title> <author> 일지매 </author> </book>");
     alert(xmldoc.xml);
     
  • 공백의 처리 : preserveWhiteSpace 속성
     xmldoc.async = false;
     xmldoc.preserveWhiteSpace = true;
     xmldoc.loadXML( "<book> <title> XML 입문 </title> <author> 일지매 </author> </book>");
     alert(xmldoc.xml);
     
     xmldoc.async = false;
     xmldoc.preserveWhiteSpace = true;
     xmldoc.load("ex07a.xml");
     alert(xmldoc.xml);
     
  • XML 문서의 저장 : save 메쏘드
  • 에러 처리 : parseError, parseError.line, parseError.linepos, parseError.reason
     xmldoc.async = false;
     xmldoc.loadXML( "<book> <title> XML 입문 </title> <author> 일지매 </authors> </book>");
     alert(xmldoc.xml);
     
     xmldoc.async = false;
     xmldoc.loadXML( "<book> <title> XML 입문 </title> <author> 일지매 </authors> </book>");
     if (xmldoc.parseError)
        alert("에러 위치 : " + xmldoc.parseError.line + "번째 라인 " + xmldoc.parseError.linepos 
                  + "번째 문자\n\n에러 이유 : " + xmldoc.parseError.reason);
     else
    alert(xmldoc.xml);
     
  • 루트 노드 찾기 : documentElement 속성
     xmldoc.async = false;
     xmldoc.load("ex07a.xml");
     var xmlroot = xmldoc.documentElement;
     alert(xmlroot.nodeName);
     
     xmldoc.async = false;
     xmldoc.loadXML( "<book> <title> XML 입문 </title> <author> 일지매 </author> </book>");

     var xmlroot = xmldoc.documentElement;
     alert(xmlroot.nodeName);

     
  • 임의의 노드 찾기 : getElementsByTagName("tagName")
  • 노드의 추가 메쏘드 : 뒤에 설명
    • createElement(name), createTextNode(data), createAttribute(name), createComment(data), createProcessingInstruction(target,data), createCDATASection(data), createEntityReference(name)

Node 객체

  • nodeName, nodeType, nodeValue, attributes, text 속성
    • nodeType = 1(element), 2(attribute), 3(text) , 4(CDATA), ...  : 표7.1 [p.215]
     xmldoc.load("ex07a.xml");
     var xmlroot = xmldoc.documentElement;
     alert('nodeName: '+xmlroot.nodeName+'\nnodeType: '+xmlroot.nodeType+
           '\nnodeValue: '+xmlroot.nodeValue+'\nattributes: '+xmlroot.attributes.length);
     alert(xmlroot.text);
     
  • Node의 운행(Traversal) 관련 속성
    • 관련속성
                                  -- previousSibling 
      ...  parentNode  -- **현재노드**    --  childNodes [ firstChild, … , lastChild ]
                                  -- nextSibling 
    • hasChildNodes() 메쏘드
  • NodeList 객체
    • length 속성, item(번호) 메쏘드
     xmldoc.load("ex07a.xml");
     var xmlroot = xmldoc.documentElement;
     if (xmlroot.hasChildNodes) {
         alert(xmlroot.childNodes.length);
         var curr = xmlroot.firstChild;
         alert(curr.xml);
         alert(curr.nodeName + curr.nodeType
          +curr.nodeValue+curr.attributes.length);
     }
     else alert('No Child');
     
     xmldoc.load("ex07a.xml");
     var xmlroot = xmldoc.documentElement;
     var curr = xmlroot.firstChild.nextSibling;
     alert(curr.xml);
     curr = curr.childNodes.item(2);
     alert(curr.xml);
     curr = curr.previousSibling;
     alert(curr.text);
     alert(curr.nodeName + curr.nodeType
          +curr.nodeValue+curr.attributes.length);
     
  • NamedNodeMap 객체 
    • getNamedItem("속성명"), setNamedItem(), removeNamedItem() 메쏘드
  • Attribute 객체 
    • name, value, specified 속성
     xmldoc.load("ex07a.xml");
     var attrs = xmlroot.firstChild.attributes;
     var attr0 = attrs.getNamedItem("InStock");
     alert(attr0.name + attr0.value + attr0.specified); 
  • 노드의 추가/삭제/수정 메쏘드 : 뒤에 설명
    • appendChild(child), insertBefore(child,before), removeChild(child),
      replaceChild(child,toReplace), cloneNode(deep)

임의 노드의 검색

  • 그 이름으로 검색
    • 노드리스트 = 문서.getElementsByTagName("tagName");
     xmldoc.load("ex07a.xml");
     var nlist =
       xmldoc.
    getElementsByTagName("book");
     for (i=0; i<nlist.length; i++)
            alert(nlist.item(i).xml);
     
     xmldoc.load("ex07a.xml");
     var nlist =
        xmldoc.
    getElementsByTagName("title");
     for (i=0; i<nlist.length; i++)
            alert(nlist.item(i).xml);
     
  • 패턴으로 검색
    • 노드리스트 = 노드.selectNode("query");
    • 노드 = 노드.selectSingleNode("query");
     xmldoc.load("ex07a.xml");
     var xroot = xmldoc.documentElement;
     var node1 = xroot.selectSingleNode("title");
     alert(node1.text);
     var tlist = xroot.selectNodes('//title');
     var alist = xroot.selectNodes('//author');
     for (i=0; i<alist.length; i++)  
        alert('['+i+'] '+alist.item(i).text+', '
               +tlist.item(i).text);

     
     xmldoc.load("ex07a.xml");
     var xroot = xmldoc.documentElement;
     var node1 = xroot.
        selectSingleNode
    ('//book[@InStock=0]');
     alert(node1.xml+'\n=> 재고가 없습니다.');
     var tlist = xroot.
        selectNodes
    ('//book[@InStock!=0]/title');
     for (i=0; i<tlist.length; i++)
        alert(tlist.item(i).text+'\n=>재고 있음.');

     

 

펌 -  http://mm.sookmyung.ac.kr/~sblim/lec/xml-int02/

MSDN - http://msdn.microsoft.com/library/default.asp?url=/library/en-us/xmlsdk/html/dom_reference.asp

신고
Posted by 나비 나비:D

vb6.0 과 xml 연동

2008.01.02 20:44

출처 : http://blog.naver.com/tjddms1117?Redirect=Log&logNo=20044343228


참고할 만한 사이트 url을 가르켜 드리죠 ^^

http://myhome.naver.com/xmlmanager/xml_lecture3_startmsxml.htm

일단 msxml의 도움말이 있는 웹사이트 주소입니다.

http://msdn.microsoft.com/library/default.asp?url=/library/en-us/xmlsdk/html/b24aafc2-bf1b-4702-bf1c-b7ae3597eb0c.asp


그리고 xml 생성에 관한 dom을 이용한 프로그래밍 데모들과 설명이 있는 페이지 입니다.

http://msdn.microsoft.com/library/default.asp?url=/library/en-us/xmlsdk/html/40ca0fcb-ed1e-4e27-92f3-fe2ce519725f.asp


msxml을 영문이나 한글 버젼은

http://www.microsoft.com/downloads/details.aspx?FamilyID=3144b72b-b4f2-46da-b4b6-c5d7485f2b42&displaylang=en


여기서 받으실 수 있습니다 밑에 chagne language 라는 combo box가 보이죠.


그 녀석을 선택하면 korean이 있습니다. 참고하세요 ^^


devpia : http://www.devpia.com/MAEUL/Contents/Detail.aspx?BoardID=65&MAEULNo=25&no=6184&ref=6184


devpia : http://www.devpia.com/MAEUL/Contents/Detail.aspx?BoardID=65&MAEULNo=25&no=7661&ref=7661

신고
Posted by 나비 나비:D

[XML Note] DOM 정리..

2007.12.17 17:31
[XML Note] DOM 정리..

1. DOM 개념 이해하기

   1-1. DOM(Document Object Model) 이란?

         1) DOM은 문서 객체 모델의 약어로 HTML과 XML 문서를 위한 API(Application Programmi

            ng Interface)로서 문서의 물리적 구조와 문서가 접근되고 다루어지는 방법을 정의한다.

         2) DOM의 목적

          (1) 다양한 환경과 애플리케이션에서 사용할 수 있는 표준적인 프로그래밍 인터페이스 제공

          (2) 프로그램 또는 스크립트를 통해 HTML이나 XML같은 웹 문서의 내용과 구조 그리고

              스타일 정보의 검색 또는 수정이 가능하도록 해주는 플랫폼 또는 언어에 중립적인 인터

              페이스이다.

         3) DOM 문서를 이용한 XML 문서 생성 과정

            (1) XML 문서를 취급하기 위하여 프로그램에서 XML 문서를 읽어들인다.

            (2) XML 문서를 XML 파서에 의해 트리 구조로 만든다.

            (3) DOM API를 이용하여 읽어들인 XML 문서에 대한 엘리먼트, 텍스트, 애트리뷰트 내용

               을 추출한 후 XML 문서를 조작(추가,삭제,갱신) 한다.

            (4) 조작되어진 XML 문서를 프로그램이 마무리하여 생성 혹은 갱신하게 된다.

   1-2. DOM Level

         1) DOM 스펙은 W3C에서 Level 단위로 만들어지고 있는데, 처음에 만든 권고안 DOM Lev

            el 1 이었고, 현재는 DOM Level 3 권고안까지 만들어진 상태이다.

         2) DOM 레벨에 관한 정보

            ⊙ DOM Level 1  : core, HTML, 그리고 XML 문서모델에 대한 내용이다. 레벨1은 문서

                                     에 대하여 항해(navigation)하거나 조작(manipulation)하는 기능을

                                     포함한다.   

            ⊙ DOM Level 2  : 스타일 쉬트를 적용한 개체모델을 지원하고 문서에 스타일 정보를

                                     조작하는 기능을 정의한다. 또한 문서에 대한 풍부한 질의 기능과

                                     이벤트 모델에 대한 정의 기능도 포함한다.  

            ⊙ DOM Level 3  : 윈도우즈 환경 하에서 사용가능한 사용자 인터페이스를 기술하는

                                     것까지 포함한다. 이를 이용하여 사용자는 문서의 DTD를 조작하는

                                     기능과 보안 레벨까지 정의할 수 있다.

   1-3. DOM 기반 Parser

         1) DOM 기반 파서는 DOM API 라는 프로그램 라이브러리를 사용한다. 이 라이브러리를

           이용하면 XML 문서의 테이터를 엑세스하고 변경하기 위해 DOM 트리에 있는 노드를

           다룰 수 있다. 여러 언어로 작성되어 있으며 보통 무료로 다운 받을 수 있다. 여러 응용

           프로그램-인터넷 익스플로러 6(msxml 3.0 기본 내장) 에서 파서를 이미 내장하고 있다.

         2) 대표적인 DOM 기반 파서 (지원버전 : DOM Level 2 SAX 2.0)

            ⊙ JAXP    : 썬 마이크로시스템의 파서(Java API for XML Parsing)

                             http://java.sun.com/xml

            ⊙ XML4J  : IBM의 파서(XML Parser for Java)

                             http://www.alphaworks.ibm.com/tech/xml4j

            ⊙ Xerces  : 아파치의 파서(Xerces Java Parser)       http://xml.apache.org/

            ⊙ msxml    : 마이크로소프트 파서    http://msdm.microsoft.com/xml           

   1-4. DOM 구조와 원리

         DOM은 XML 문서에 노드 클래스의 하위 클래스 인스턴스로 표현되는 노드들의 트리로

        표현되는데, 특정 노드의 하위클래스는 요소, 텍스트, 주석이 될 수 있다. 따라서 DOM은

        트리 구조로서 XML 문서를 다루게 되는 것이다.

         1) DOM을 이용한 XML 문서변환

            XML 문서를 응용프로그램이 파싱 요청을 하면 XML 파서에 의해 해석한 후 DOM 인터

           페이스를 이용하여 응용프로그램과 정보를 서로 전달하여 XML문서를 조작하도록 하고

           있다.

         2) XML 문서와 DOM 트리구조

            (1) XML 문서

                <?xml version="1.0" encoding="euc-kr" ?>

                   <책>

                       <제목>XML 정목</제목>

                       <발행년도>2004년 발행</발행년도>

                   </책>

            (2) DOM 노드 트리 모델링

                                           [ Document ]

                                             (NodeList)

                                           [Element "책"]    

                                             (NodeList)     

                   (NodeList)                                        (NodeList)

                [Element "제목"]                             [Element "발행년도"]

          [NamedNodeMap "분류"]                    [NamedNodeMap "분류"] 

                 [Att Node "컴퓨터"]                        [Att Node "발행"]

                   (NodeList)                                        (NodeList)

    [Text CharacterData "XML 정복"]         [Text CharacterData "2004년 발행"]

         3) XML 문서에서의 객체

            (1) XML 문서

                <?xml version="1.0" encoding="euc-kr" ?>

                   <책>

                       <제목 분류="컴퓨터">XML 정복</제목>

                       <발행년도 분류="발행">2004년 발행</발행년도>

                   </책>

            (2) XML 객체

                ⊙ Documents  : 작성된 전체 문서를 대표하는 객체이다.

                ⊙ <책> : 2개의 하위 요소 객체인 <제목>과 <발행년도>를 포함한 루트 객체이다.

                ⊙ <제목> : 다음 요소객체로 <발행년도>를 갖고 "XML 정복"라는 text객체를 소유함.

                ⊙ XML 정복 : <제목> 객체의 text객체가 된다.

                ⊙ <발행년도> : 이전 요소객체로 <제목>를 갖고 "2004년 발행"이라는 text객체를 소유

                                      한다.      

                ⊙ 2004년 발행 : <발행년도> 객체의 text객체가 된다.  

2. DOM API

    2-1. DOM 인터페이스

          1) W3C에 의해 추천된 프로그래밍 규격으로, 프로그래머가 HTMl 페이지나 XML 문서들을

             프로그램 객체로 만들거나 수정할 수 있도록 해주며, 그저 데이터 구조의 형태로 문서를

             표현하고 있는 현재의 HTML과 XML 문서들을 DOM 인터페이스를 사용하여 마치 프로

             그램 객체처럼, 자신들의 컨텐츠나, 객체 내에 감추어진 데이터를 가질 수 있게 됨으로써,

             문서를 조작할 수 있게 된다.

             ⊙ Document

             ⊙ Node

             ⊙ Nodelist

             ⊙ Element

             ⊙ NamedNodeMap

    2-2. Document 인터페이스

          Document 인터페이스는 HTML 또는 XML 문서를 나타내기 위해 사용하는데 문서 트리

         구조에서 최상위 루트에 해당한다.

          1) Document 인터페이스의 특징

              (1) 엘리먼트, 텍스트노드, 주석(comments), 처리 명령(processing instructions) 등을

                  포함하지 않고는 Document 인터페이스가 존재할 수 없다.

              (2) Document 인터페이스는 이 객체들을 만드는데 필요한 메소드 요소들도 포함하며

                  생성된 Node 객체들은 Document와 Node를 관련짓는 속성을 가진다.

              (3) Document 인터페이스

                   ⊙ Element getDocumentElement()

                   ⊙ NodeList getElementsBytagName(String tagname)

                   ⊙ Element createElement(String tagName)

                   ⊙ Text createTextNode(String data)

                   ⊙ Attr createAttribute(String name)                 

          2) Document 인터페이스의 메소드

              (1) Element getDocumentElement()

                   XML 문서에서 루트요소를 얻기 위해 메소드로 처음 XML 트리 구조를 접할 때 가장

                  먼저 루트요소를 접근한 후에 세부적으로 접근하게 된다.

              (2) NodeList getElementsBytagName(String tagname)

                   XML 문서에서 요소리스트를 얻기 위해 사용되는 메소드인데 인자 값은 tagName이

                  올 수 있는데 tagName 이후의 모든 요소리스트를 반환하게 된다.

              (3) Element createElement(String tagName)

                   지정된 형식의 ELEMENT를 생성하는 메소드이다. 이 메소드는 인자 값으로

                  tagName을 사용할 수 있는데 XML에서 설명한 엘리먼트 형식 이름이다.          

              (4) Text createTextNode(String data)

                   지정된 문자열을 가진 Text 노드를 생성하는 메소드로 인자 값으로 그 노드에 대한

                  데이터를 가지며 리턴 되는 값은 새로운 Text 객체이다.

              (5) Attr createAttribute(String name)

                   주어진 이름의 Attribute를 생성하는데 인자 값은 속성의 이름인 name이다. 또한 반환

                  값은 새로운 Attr객체로써 만약 이름이 적당하지 않은 문자를 포함하면 에러를 발생함.

          3) Node 인터페이스

              Node 인터페이스는 XML 문서에서 노드 트리의 각 요소를 읽고 쓰기 위해 사용되는데

             DOM에서 가장 기본적인 자료형으로 쓰인다.

              (1) Node 인터페이스의 특징

                   Node 인터페이스는 원소, 주석, 속성들을 상속받으며 이중에 최하위 노드인 Text

                  노드는 자식을 가질 수 없다. 만약 Text노드에 자식을 추가하면 DOMException 에러

                  가 발생하게 된다.

                  ▣ 노드에 관한 정보(NodeType)

구분

노드종류

노드명

노드값

Element

ELEMENT_NODE

요소명

null

Attribute

ATTRIBUTE_NODE

속성명

속성값

Text

TEXT_NODE

#text

노드의 내용

CDATA

CDATA_SECTION_NODE

#cdata-section

노드의 내용

Entity

ENTITY_NODE

참조된 엔티티 이름

null

Entity

Reference

ENTITY_REFERENCE_NODE

선언된 엔티티 이름

null

Processing Instruction

PROCESSING_INSTRUCTION_NODE

PI이름

PI이름을 제외한 전체 내용

comment

COMMENT_NODE

#comment

주석 내용

Document

DOCUMENT_NODE

#document

null

Document Type

DOCUMENT_TYPE_NODE

루트요소명

null

Notation

NOTATION_NODE

Notaion선언이름

null

DOCUMENT

FRAGMENT

DOCUMENT_FRAGMENT

#document-fragment

null

 

              (2) Node 인터페이스의 메소드

                  ▣ Node getFirstChild() : 현재 노드의 첫 번째 노드를 나타내고 만약 그런 노드가

                     없으면 null값을 반환하며 리턴값은 node이다.                  

                  ▣ Node getNextSibling() : 현재 노드의 바로 다음 노드를 나타낼 때 사용되는 메소

                     드로서 만약 해당 노드가 없으면 null값을 반환하고, 리턴값은 node이다.

                  ▣ short getNodeType() : 노드의 종류를 나타내는 메소드로 반환되는 값은 정수형

                     값을 가진다.

                     < 노드의 종류와 상수 값 >

멤버필드 이름

정수값

노드 종류

Node.ELEMENT_NODE

1

Element

Node.ATTRIBUTE_NODE

2

Attr

Node.TEXT_NODE

3

Text

Node.CDATA_SECTION_NODE

4

CDATASection

Node.ENTITY_REFERENCE_NODE

5

EntityReference

Node.ENTITY_NODE

6

Entity

Node.PROCESSING_INSTRUCTION_NODE

7

ProcessingInstruction

Node.COMMENT_NODE

8

Comment

Node.DOCUMENT_NODE

9

Document

Node.DOCUMENT_TYPE_NODE

10

DocumentType

Node.DOCUMENT_FRAGMENT_NODE

11

DocumentFragment

Node.NOTATION_NODE

12

Notation


    ▣ string getNodeName() : 노드의 이름을 나타내는 메소드로 해당 노드의 이름을  문자열 형으로 반환한다.    

    ▣ string getNodeValue() : 노드의 값을 나타내는 메소드로 문자열형으로 해당 노드의 값을 반환한다.

    ▣ Document getOwnerDocument() : 현재 노드와 연결된 Document 객체를 나타내는 메소드로 새로운 노드를 만드는 데 사용되는 Document 객체이기도 하다. 이 노드가 Document이면 null값을 반환한다.

    ▣ Node appendChild(Node newChild) : appendChild 메소드는 새로운 노드를  추가할 때 사용하는데, newChild 노드를 현재 노드의 자식 리스트의 끝에 삽입한다. newChild가 DocumentFragment객체이면 DocumentFragment의 전체 내용이 현재 노드의 자식 리스트 안으로 삽입된다.

    ▣ Node getParentNode() : getParentNode 메소드는 현재 노드의 부모 노드를 나타

     내는 메소드로 All nodes, except Document, DocumentFragment, 그리고 Attribute

    를 제외한 모든 노드가 부모를 가질 수 있다. 그러나 노드가 만들어졌지만 트리에 추가되지 않았거나 트리에서 제거되지 않았을 경우 이것은 null 값을 반환한다.

    ▣ Node insertBefore(Node newChild, Node refChild) : insertBefore 메소드는 원하는 특정 위치(refChild)에 새로운 노드(newChild)를 삽입할 때 사용하느데, 이때 삽입되는 위치는 refChild의 이전 위치가 된다. 만약 refChild가 null값이면 자식 리스트의 끝에 newChild를 삽입하고, newChild가 DocumentFragment 객체이면refChild 앞에 같은 순서로 모든 자식들이 삽입된다. 만약 newChild가 이미 트리안에 있으면 먼저 제거된 후에 삽입된다.

    ▣ Node replaceChild(Node newChild, Node refChild) : replaceChild 메소드는새 노드를 나타내는 newChild와 리스트에서 대체되는 노드를 나타내는 refChild를 가지며, 노드 refChild를 newChild로 대체한다. newChild가 이미 트리상에 존재하지만 먼저 제거한 후에 삽입된다.

    ▣ Node removeChild(Node oldChild) : removeChild 메소드는 인자 값으로 제거될노드 oldChild를 가지며, 자식 리스트로부터 oldChild에 해당하는 노드를 제거한다. 만약 현재 노드가 읽기 전용일 때에는 NO_MODIFICATION_ALLOWED_ERR 에러를 발생시킨다.

    ▣ NamedNodeMap getAttributes() : 노드의 속성리스트를 얻는다.

          4) NodeList 인터페이스                       

             NodeList 인터페이스는 노드들의 집합이 구현되는 방법을 정의하거나 순서가 있는 노드

             들의 집합을 표현할 때 사용한다.

              (1) NodeList 인터페이스의 특징

                   NodeList에서의 아이템은 0부터 시작되는 정수 인덱스에 의하여 접근할 수 있으며

                  NodeList를 통해 얻은 노드들의 순서는 XML에서 부모노드로부터 추가한 순서가

                  된다.

              (2) NodeList 인터페이스의 메소드

                  ▣ int getLength() : 노드의 개수를 나타내는데 자식 노드 인덱스 범위은 0에서

                     length-1까지이다.

                  ▣ Node item(int index) : 노드리스트 안에서 노드의 인덱스 값을 인자로 가지며,

                     노드리스트에서 index가 가리키는 노드를 반환한다. 또한 index가 리스트에서의

                     노드 개수보다 많거나 같을 때에는 null값을 반환한다.    

     5) Element 인터페이스                       

         Element 인터페이스는 HTML 문서 또는 XML 문서의 원소를 표현하기 위해 사용된다.

         (1) Element 인터페이스의 특징

          Attribute 객체 또는 속성값 등을 검색할 수 있는 메소드를 가지고 있다. 그리고 모든속성이 간단한 문자열 값을 가지는 HTML에서 속성값에 직접 접근할 수 있는 방법들이 사용될 수 있다.

         (2) Element 인터페이스의 메소드

          ▣ getAttribute(String name) : 검색할 속성이름인 name을 인자로 갖는다. 이때 반환되는 값은 문자열인 Attr 값, 또는 그 속성이 지정된 값을 갖는데 만약, 기본 값이없을 경우 빈 문자열이 된다.

          ▣ setAttribute(String name, String value) : 주어진 이름과 값을 갖는 속성을 추가하  는데 동일한 이름을 가진 속성이 존재할 경우 값을 변경한다.    

          ▣ removeAttribute(String name) : 주어진 이름(name)의 속성을 제거하는 메소드인  데 현재 노드가 읽기 전용일 때 NO_MODIFICATION_ALLOWD_ERR 에러를 발생시키며 반환 값은 없다.

     6) NameNodeMap 인터페이스                       

        NameNodeMap 인터페이스는 NodeList의 기능과 유사한데 이름을 이용하여 노드에 접근하고 NameNodeMap을 구현하는 객체에 포함된 속성들을 추출할 때 사용한다.

        (1) NameNodeMap 인터페이스의 특징

         접근하려는 노드들은 이름과 0부터 시작하는 정수 인덱스 값을 이용해 추출할 수 있다.

        (2) NameNodeMap 인터페이스의 메소드

          ▣ Node getNamedItem(String name) : 이름을 이용하여 지정된 노드를 검색하고,  검색할 노드의 이름을 인자로 갖는다. 반환되는 값은 지정된 이름을 가진 노드이며지정된 이름이 맵에서 어떤 노드도 일치 않으면 null 값을 반환한다.

          ▣ Node removeNamedItem(String name) : 제거될 노드의 이름을 이자로 가지며  이름에 의해 지정된 노드를 제거한다. 만약 동일한 이름의 노드가 없다면 null값을반환한다. 그리고 맵 전체에 지정한 이름의 노드가 없을 때 NOT_FOUND_ERR 에러를 발생시킨다.    

          ▣ Node item(int index) : 정수를 인자로 가지며 index에 해당하는 Attr 노드 객체를 리턴하고, index에 해당하는 특성이 존재하지 않으면 null값을 리턴한다.

출처 : Tong - 블루라임님의 XML통

신고
Posted by 나비 나비:D
태그 DOM, xml

BLOG main image
by 나비:D

공지사항

카테고리

분류 전체보기 (278)
Programming? (0)
----------------------------- (0)
나비의삽질 (5)
Application (177)
SQL (51)
Web (27)
etc. (14)
Omnia (0)
---------------------------.. (0)

글 보관함

달력

«   2017/12   »
          1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31            
Total : 894,884
Today : 42 Yesterday : 238