Đọc và ghi XML với C# – Read and Write XML with C#

xml

XML (eXtensible Markup Langue) đóng một vai trò quan trọng trong .NET. Không chỉ vì .NET cho phép bạn sử dụng XML trong các ứng dụng của bạn, mà bản thân nó cũng sử dụng XML cho những file cấu hình và tài liệu mã nguồn, như SOAP, các dịch vụ web và Ado.net. Do đó tìm hiểu về các xử lý XML trong .Net với ngôn ngữ C# là một điều nên làm. Bài viết này sẽ đi từng bước trong quá trình với những ví dụ demo cụ thể.

1. Giới thiệu về namespace System.xml (introduction to namespace System.xml)

–  namespace System.xml trong .NET cung cấp  một số lớp hỗ trợ cho việc xử lý XML. Dưới đây là những lớp đọc và ghi XML.

Tên lớp Giải thích
XmlReader Một lớp đọc trừu tượng nhanh và non-cached dữ liệu XML. XmlReader được thiết kế giống như bộ phân tách SAX.
XmlWriter Một lớp viết trừu tượng nhanh và non-cached dữ liệu XML trong một dòng hoặc định dạng file.
XmlTexReader Mở rộng của XmlReader. Cung cấp chuỗi truy cập nhanh dữ liệu XML.
XmlTexWriter Mở rộng của XmlWriter. Phát nhanh các dòng XML.

–  Một vài lớp hữu ích khác trong XML:

Tên lớp Giải thích
XmlNode Một lớp trừu tượng miêu tả một nút đơn trong một tài liệu XML. Lớp cơ sở cho các lớp khác trong namespace XML.
XmlDocument Mở rộng của XmlNode. Đây là một thực thi W3C Document Object Model (DOM). Nó cung cấp một cây miêu tả tài liệu XML trong bộ nhớ cho phép điều hướng và soạn thảo.
XmlDataDocument Mở rộng của XmlDocument. Đây là một tài liệu có thể được tải từ dữ liệu XML hoặc từ dữ liệu trong một ADO.NET DataSet. Cho phép hòa trộn XML và dữ liệu quan hệ trong cùng một view.
XmlResolver Một lớp trừu tượng dùng giải quyết các tài nguyên XML ngoài như DTD và tham chiếu sơ đồ. Cũng dùng để xử lí các thành phần <xsl:include> và <xsl:import>.
XmlUrlResolver Mở rộng của XmlResolver. Giải quyết các tài nguyên tên như một URI (Uniform Resource Identifier).

– Lưu ý:  namespace xml có sẵn cho bất kỳ ngôn ngữ nào biết .NET

2. Đọc và Ghi XML (Read and write Streamed XML)

–  Cả 2 lớp XmlReader và XmlWriter đều là những lớp trừu tượng. Hình dưới đây minh họa các lớp kế thừa từ 2 lớp này:image

+ XmlTextReader và XmlTextWriter làm việc chung trên các đối tượng stream hoặc các đối tượng TextReader/TextWriter trong namespace System.IO.

+ XmlNodeReader sử dụng XmlNode cho một nguồn thay cho một stream. XmlValidatingReader thêm DTD với sơ đồ tích hợp và tất nhiên là cả dữ liệu hợp lệ.

2.1  Sử dụng lớp XmlTexReader

– XmlTexReader rất giống SAX. Một trong những khác biệt lớn nhất: SAX là một mô hình kiểu push, còn XmlTextReader là một mô hình pull, ở đó dữ liệu được kéo vào ứng dụng yêu cầu nó. Nó tạo ra một mô hình lập trình dễ dàng và trực quan hơn. Một lợi ích khác của mô hình pull là có thể lựa chọn dữ liệu để gởi đến ứng dụng: nếu bạn không muốn tất cả các dữ liệu, vì không cần xử lý tất cả chúng. Còn trong mô hình push, tất cả dữ liệu XML cần phải được xử lý bởi ứng dụng, mặc cho nó có muốn hay không.

–  Để sử dụng lớp này bạn cần khai báo :

using System.Xml;

– Đây là file “Book.xml” dùng để sử dụng trong các ví dụ của chương trình (click vào đây để download nó về máy tính để).

– Bây giờ hãy mở visual studio của bạn lên: image

+  Kéo vào một ListBox và một Button như hình bên;

+ Sau đó viết sự kiện cho button Load XML như sau:

+ Click vào đây để down project demo ví dụ này viết bằng visual studio 2010

private void btnLoadXML_Click(object sender, EventArgs e)
        {
            // Đường dẫn tới file xml.
            string fileName = "Book.xml";
            // Tạo một đối tượng TextReader mới
            XmlTextReader xtr = new XmlTextReader(fileName);
            while (xtr.Read())
            {
                if (xtr.NodeType == XmlNodeType.Text)
                {
                    listBox1.Items.Add(xtr.Value);
                }
            }
        }

image

– Kết quả khi chạy chương trình trên và click vào button LoadXML như hình bên.

–  XmlTextReader này sử dụng khá đơn giản.

+  Trước tiên chúng ta tạo ra một đối tượng string chứa dường dẫn tới file xml. Sau đó tạo một đối tượng XmlTextReader mới với tham số là đường dẫn tới file xml.

+  Khi chương trình chạy đến vòng lặp while, phương thức Read sẽ được di chuyển sang mục tiêu đầu tiên trong tài liệu. Nó tiêu biểu cho các mục khai báo XML. Trong ví dụ này, chúng ta duyệt qua từng mục và so sánh xtr.NodeType với bộ XmlNodeType, và thêm các mục được tìm thấy vào listbox.

2.2 Các phương thức Read

– Có một vài cách di chuyển trong tài liệu. Như bạn đã thấy trong ví dụ trên, Read() có thể di chuyển sang mục tiếp theo. Chúng ta có thể xem nêu mục đó có giá trị (HasValue()) , hoặc nếu mục đó có thuộc tính (HasAttributes()) . Chúng ta cũng có thể dùng phương thức ReadStartElement(), để kiểm tra xem nếu mục hiện tại là thành phần khởi đầu, và chuyển sang mục tiếp theo. Nếu không phải là mục khởi đầu một ngoại lệ XmlException sẽ được phát ra. Việc gọi phương thức này giống như gọi phương thức IsStartElement(), bởi một Read().

–  Các phương thức ReadString() và ReadChars() đều đọc dữ liệu văn bản từ một thành tố. ReadString() tra về một chuỗi dữ liệu, trong khi ReadChars() trả về một mảng dữ liệu kiểu char.

–  ReadElementString() cũng giống như ReadString(), ngoại trừ việc bạn không phải truyền tên của một thành tố. Nếu nội dung của mục tiếp theo không phải là một start tag, hoặc nếu tham số Name không không phải là Name của mục hiện hành, thì một ngoại lệ sẽ được phát ra.

–  Dưới đây là ví dụ chỉ ra cách sử dụng ReadElementString(), lưu ý khai báo:

using System.IO;

private void btnLoadXML_Click(object sender, EventArgs e)
{            string fileName = “Book.xml”;
FileStream fs = new FileStream(fileName, FileMode.Open);
XmlTextReader xtr = new XmlTextReader(fs);
while (!xtr.EOF)
{
if (xtr.MoveToContent() == XmlNodeType.Element && xtr.Name == “title”)
{
listBox1.Items.Add(xtr.ReadElementString());
}
else
{
xtr.Read();
}
}

}

–  Trong vòng lặp while chúng ta sử dụng MoveToContent() để tìm  trên mỗi dòng xem XmlNodeType.Element có giống với named title không. Chúng ta sử dụng thuộc tính EOF của XmlTextReader như là một điều kiện lặp. Nếu mục không phải kiểu Element của named title, mệnh đề else phát ra một phương thức Read() để di chuyển sang mục tiếp theo. Khi chúng ta tìm thấy một mục thỏa điều kiện, chúng ta trả kết quả của ReadElementString() cho listbox. Nó cho phép các tựa sách được liệt kê trong listbox. Chú ý rằng chúng ta không tạo ra một lời gọi Read() sau khi một ReadElementString() thực hiện thành công. Bởi vì ReadElementString() cũng sẽ di chuyển sang mục tiếp theo.

–   Nếu bạn bỏ && tr.Name==”title” trong mệnh đề if, bạn sẽ nhận được ngoại lệ XmlException. Nếu nhìn vào file dữ liệu, bạn sẽ thấy thành tố đầu tiên mà MoveToContent() tìm ra là <bookstore>. Tất nhiên nó vì nó không chứa một kiểu text chuẩn, nên ReadElementString() phát ra một ngoại lệ   XmlException.

2.3  Lấy thuộc tính của dữ liệu:

–  Khi bạn chạy các ví dụ trên, bạn nhận ra rằng khi các mục được đọc, bạn không thấy bất kì thuộc tính nào cả. Đó là vì các thuộc tính không nằm trong tài liệu. Khi đang đứng trên một imagemục, bạn có thể kiểm tra các thuộc tính và có thể lấy giá trị của bất kì giá trị thuộc tính nào.

–  Thuộc tính HasAttributes sẽ trả về giá trị true nếu có bất kì thuộc tính nào còn không sẽ trả về false. Thuộc tính AttributeCount sẽ cho bạn biết có bao nhiêu thuộc tính, và phương thức GetAttribute() sẽ trả về một thuộc tính thông qua tên hoặc chỉ mục. Nếu bạn muốn lặp qua các thuộc tính bạn có thể dùng các phương thức MoveToFirstAttribute() và MoveToNextAttribute().

–  Dưới đây là một ví dụ về việc lặp qua các thuộc tính.

string fileName = “Book.xml”;
FileStream fs = new FileStream(fileName, FileMode.Open);
XmlTextReader xtr = new XmlTextReader(fs);
while (xtr.Read())
{
if (xtr.NodeType == XmlNodeType.Element)
{
for (int i = 0; i < xtr.AttributeCount; i++)
{
listBox1.Items.Add(xtr.GetAttribute(i));
}
}
}

–  Bây giờ chúng ta xem xét về các mục thành phần. Khi chúng ta tìm thấy một mục, chúng ta lặp qua tất cả thuộc tính của nó, và dùng phương thức GetAttribute() để load giá trị của thuộc tính vào listbox. Trong ví dụ này các thuộc tính đó là genre, publicationdate, và ISBN.

2.4  Sử dụng lớp XmlValidatingReader

–  Nếu bạn muốn xác nhận một tài liệu XML, bạn sẽ cần phải sử dụng lớp XmlValidatingReader. Nó chứac các khả năng giống như XmlTextReader (Cả hai đều xuất phát từ XmlReader) nhưng XmlValidatingReader có thêm thuộc tính ValidationType, thuộc tính Schemas và SchemaType.

–  Nếu bạn gán thuộc tính ValidationType giá trị xác nhận mà bạn muốn. Giá trị hợp lệ của thuộc tính này được liệt kê trong bảng sau:

Property value Description
Auto Nếu một DTD được khai báo trong một khai báo <!DOCTYPE…>, điều này cho phép DTD sẽ được load  và xử lí. Giá trị mặc định cho các DTD.Nếu một thuộc tính XSD schemalocation được tìm thấy, XSD được load và xử lí, và sẽ trả về các giá trị mặc định trong sơ đồ.

Nếu một không gian tên với tiếp đầu ngữ MSXML x-schema được tìm thấy,  nó sẽ load và xử lí sơ đồ XDR và trả về các thuộc tính mặc định đã được định nghĩa.

DTD Phù hợp theo chuẩn DTD.
Schema Phù hợp theo sơ đồ XSD.
XDR Phù hợp theo sơ đồ XDR
None Không giá trị hợp lệ nào được thực thi.

–  Khi một thuộc tính trong này được chọn, Một ValidationEventHandler cần phải được gán. Đây là một sự kiện được tạo ra do các lỗi. Bạn có thể tác động lại lỗi theo các mà bạn cho là phù hợp.

2.5  Sử dụng Schema property

Schemas property của XmlValidatingReader chứa một XmlSchemaCollection, có thể tìm thấy trong không gian tên System.Xml.Schema. Tập hợp này tổ chức load lại loaded XSD và XDR schemas. Nó cực nhanh đặc biệc là khi bạn cần kiểm tra sự hợp lệ của nhiều tài liệu khác nhau, vì sơ đồ sẽ không được load mỗi khi kiểm tra. Các bước sử dụng thuộc tính này như sau, bạn tạo một đối tượng XmlSchemaCollection. Phương thức Add(), nằm trong một XmlSchemaCollection, có bốn quá tải. Bạn có thể truyền nó cho một đối tượng xuất phát từ XmlSchema, một đối tượng xuất phát từ XmlSchemaCollection, một chuỗi không gian tên với chuỗi URI của file sơ đồ và một đối tượng xuất phát từ XmlReader chứa trong sơ đồ.

2.6  Sử dụng lớp XmlTextWriter

–   Lớp XmlTextWriter cho phép bạn xuất XML thành một chuỗi, một file hoặc một đối tượng a TextWriter. Giống như XmlTextReader, nó là một kiểu forward-only, non-cached. XmlTextWriter có thể cấu hình cao, cho phép bạn chỉ rõ những thứ như cho phép thục đầu dòng, số thục đầu dòng, kí tự chỉ dẫn nào được dùng trong các giá trị thuộc tính cho phép namespace hỗ trợ.

–  Hãy xem ví dụ sau, để biết cách sử dụng lớp XmlTextWriter

private void btnGhiXML_Click(object sender, EventArgs e)
{
    SaveFileDialog sfd = new SaveFileDialog();
    sfd.Filter = "XML file(*.xml)|*.xml";
    sfd.RestoreDirectory = true;\
    if (sfd.ShowDialog() == DialogResult.OK)
    {
        XmlTextWriter xtw = new XmlTextWriter(sfd.FileName, null);
        xtw.Formatting = Formatting.Indented;
        xtw.WriteStartDocument();

                // write to element HoTen
                xtw.WriteStartElement("LyLich");

                xtw.WriteAttributeString("QuocTich", "Viet Nam");
                xtw.WriteElementString("HoTen", txtHoTen.Text);
                xtw.WriteElementString("QueQuan", txtQueQuan.Text);
                xtw.WriteElementString("NgaySinh", txtNgaySinh.Text);

                xtw.WriteEndElement();
                xtw.WriteEndDocument();
                xtw.Flush();
                xtw.Close();
    }
}

–  Chương trình demo có giao diện như sau:

image

Khi nhấn button ghi ra file XML thì hộp thoại saveFileDialog sẽ hiện ra để bạn chọn đường dẫn lưu file. Bạn điền tên file rồi sau đó chọn save thì file sẽ lưu lại với đuôi mở rộng là .xml với tên mà bạn đã đặt cho nó.

Sau đó bạn click chuột phải vào file xml vừa được tạo ra chọn Edit thì sẽ thấy nội dung mà chương trình đã ghi ra.

–   Các thành phần được điều khiển bằng việc theo dõi khi nào bạn bắt đầu và kết thúc thao tác viết các thành phần các thuộc tính. Bạn có thể bắt gặp chúng khi chúng ta thêm vào tên của thành phần con cho các thành phần lớn. Chú ý việc các lời gọi phương thức WriteStartElement() và WriteEndElement() được tổ chức như thế nào và các tổ chức các sản phẩm các bộ thành phần trong file xuất.

–   Các phương thức WriteElementString() và WriteAttributeString(), có một vài phương thức ghi đặc biệc. WriteCData() sẽ xuất ra một đoạn CData (<!CDATA[…]]>), việc xuất ra các text cần một tham số. WriteComment() xuất ra một ghi chú theo định dạng XML. WriteChars() xuất ghi chi của của một chuỗi các kí tự. Điều này cũng tương tự phương thức ReadChars() mà chúng ta đã biết; chúng đều sử dụng cùng các tham số. WriteChars() cần một vùng đệm (một mảng kí tự) Vị trí bắt đầu đẻ ghi (một số integer) số các kí tự sẽ ghi (một số integer).

–   Thao tác đọc và ghi XML dùng các lớp xuất phát từ XmlReader và XmlWriter đơn giản và mềm dẻo đến hơn chúng ta tưởng tượng rất nhiều.

–  Click vào đây để download project demo việc ghi ra file XML

Advertisements

About thanhcuong1990

Handsome and talent!! ^^
This entry was posted in XML. Bookmark the permalink.

34 Responses to Đọc và ghi XML với C# – Read and Write XML with C#

  1. Toan Tran says:

    Xin các bạn giúp mình dùng ngôn ngữ C sharp chuyển 1 file dữ liệu XML sang CSDL quan hệ và ngược lại, mình phải làm tiểu luận môn học. Thanks.

    • Bạn có thể tham khảo ở địa chỉ này: http://www.dotnetspider.com/resources/Category534.aspx
      Trang đó có nhiều bài viết về XML và có cả những bài mà bạn cần tìm.

      • Toan Tran says:

        Cảm ơn bạn nhiều.
        Nhưng GV mình yêu cầu mình viết chương trình bằng C# đọc 1 file XML bất kỳ vào rồi sinh ra lược đồ trung gian bằng công cụ HDM(HyperGraph Data Model: Người ta gọi là siêu đồ thị) từ đây chuyển qua CSDL quan hệ và ngược lại.
        Khó quá, có ai biết help mình với!!!Mình chỉ nghe nói công cụ DOM,SAX,CPI….chứ chưa thấy ai sử dụng HDM bao giờ!!!!

  2. dqdan says:

    Có thể sử dụng lớp XmlTextWriter để ghi thêm dữ liệu vào file XML không?
    Dùng hàm kiểm tra xem đã tồn tại file xml chưa. Nếu chưa thì tạo file, Nếu có rồi thì mở lên và ghi thêm vào có được không?

    • Tất nhiên là có thể làm được rồi. Bạn có thể viết một hàm kiểm tra xem tên file đó có tồn tại trước không, nếu có thì bạn chỉ việc sử dụng hàm mở file đó lên và ghi tiếp vào.

      • Anh says:

        Mình có ví dụ thế này, ……, mình muốn hỏi bạn làm sao để ghi thêm (append) các sau (BookStore là tag root)?

  3. Hoàng says:

    Cho mình hỏi caí hàm Flush(); để làm gì vậy bạn 🙂

  4. chipbaby says:

    Cho mình hỏi bạn có thể đưa ra ví dụ về cách reading & writting XMLDocument trong .NET không vậy ? thank bạn vì bài viết này!

  5. khai22191 says:

    Chào anh ạ. em có một vấn đề thế này:
    em có 1 file XML chứa danh sách 2 loại từ khóa. một loại là màu xanh (blue), loại kia là màu đỏ (red)

    Form
    EventArgs
    Regex
    List
    Point
    XElement

    abstract
    as
    base
    bool</key

    để in tất cả từ khóa trong file này ra thì em biết rồi. nhưng làm sao để chỉ in ra các từ khóa có màu blue thôi ạ?
    Em đang làm đồ án cần cái này gấp. em cảm ơn!

  6. khai22191 says:

    Xin lỗi, em không biết Post Code. file XML của em ở link này ạ: http://www.mediafire.com/?9hip6on7wd3y60a

  7. Trần Văn Tiến says:

    Em muốn hỏi.
    Giả sử em có một tài liệu XML định dạng như sau:

    Anz – Atm
    <![CDATA[14 Lê Thái Tổ, Hanoi, Vietnam]]>
    14 Lê Thái Tổ, Hanoi<br/>Vietnam

    normal

    highlight

    105.851204,21.029241,0

    gồm rất nhiều Placemark.
    Bây h em chỉ muốn lấy thông tin trong 3 thẻ trong Placemark là :
    Anz – Atm
    14 Lê Thái Tổ, Hanoi<br/>Vietnam
    105.851204,21.029241,0
    Nhưng em đọc các cách thức phân tích xml trên mà chưa biết làm:D
    Với kiểu XML nhiều tầng mà chỉ lấy số it thì làm thế nào. Mong a giúp.
    Em làm với android java phân tích bằng saxXML rất dễ nhưng khi làm với C# chưa hiểu:D

  8. Trần Văn Tiến says:

    http://www.mediafire.com/?ivbbdlq020xg9gq
    Không hiểu sao post định dạng xml lại lỗi.Dây file của em.

  9. Anh Trần says:

    Bạn có thể cho mình hỏi dạng xml này http://www.mediafire.com/?mef50cg0c0lcr8z
    cấu trúc nó ra sao, giờ mình làm sao có để read &write
    Bạn có thể có tài liệu hay vd để lấy dữ liệu dạng xml này hok !!
    Thanks bạn nhiều.

  10. VietNam says:

    anh đẹp zai oi thêm mới,xóa ,sửa ,tìm kiếm và đổ dữ liệu vào textbox ko thông qua datalist or girview kiểu gì thế cho em xin code dc ko anh zai

  11. Nguyen Minh Hieu says:

    xin cho e hỏi, e có một đoạn code dùng để upload và đưa dữ liệu vào web asp.net có sử dụng xml. Tuy nhiên e bị mắc phải lỗi System.IO.FileNotFoundException: Could Not Find File. Xin hỏi cách khắc phục

    • Lỗi này là không tìm thấy file upload. Bạn kiểm tra lại code có sai chỗ nào không. Chứ bạn nói không không vậy mình cũng chịu. 😀

  12. duong says:

    bạn ơi bạn có code từ điển bằng c# và xml không

  13. Trung Lê says:

    Bạn ơi, vậy nếu mình không dùng vòng lặp Foreach thì làm sao để lấy được cái chuỗi tag name vậy bạn. Vì mình phải chuyển nó ra Excel nếu dùng Foreach thì nó sẽ chạy hết ra 1 hàng 😦

    • Bạn có thể dùng if trong vòng lặp mà. Ngoài ra cũng có thể dùng for bình thường, không cần phải dùng foreach.

      • Trung Lê says:

        Ý là mình hỏi câu lệnh viết nó như thế nào ấy, vì mình thường viết thế này:
        foreach (XmlNode xn in xnList)
        {
        //Chuỗi chứa nội dung các dòng
        string _devicename = xn[“grid-alarm-device-name”].Name;
        string _devicename = xn[“grid-alarm-device-name”].InnerText;
        }
        Còn nếu không có Foreach thì mình không biết viết nó ra sao.

  14. Trung Lê says:

    Anh ơi, hiện em đã lấy được các giá trị đó rồi, nhưng dữ liệu giữa các dòng bị trùng nhau:
    for (int i = 0; i <= note; i++)
    {
    row = sheet.Table.Rows.Add();
    row.Cells.Add(new WorksheetCell(_alarmtype.Value));
    row.Cells.Add(new WorksheetCell(_gpstime.Value));
    row.Cells.Add(new WorksheetCell(_recivetime.Value));
    }
    Em biết lý do này là do em không truyền biến i vào các dòng, như vậy để truyền vào phải làm sao anh.

  15. bạn ơi mấy cái link demo không down dc…bạn xem lại giúp mình với

  16. Chào bạn Thanh Cường, bài viết của bạn rất hay. Nhưng những link trong bài viết bị die hết rồi.
    Mong bạn sớm sưa lại link cho bài viết.
    Cảm ơn đã lắng nghe ý kiến.

  17. GoldBaby says:

    Chào bạn! Ở bài của bạn ở trên thì toàn là thao tác trên file xml đã có sẵn dữ liệu bên trong. Vậy nếu như mình có 1 file xml file này có thể có dữ liệu hoặc chưa. Vậy mình muốn kiểm tra thử xem nó đã có dữ liệu hay chưa thì mình nên sao vậy bạn? Tại vì khi mình dùng DataSet.ReadXML, nếu file đó đã có dữ liệu thì không sao. Nhưng nếu file chưa có dữ liệu thì nó báo lỗi. Mong được bạn giúp đỡ

  18. gacon says:

    em có xem demo của anh, nhưng e còn mơ hồ quá, nếu em lấy dữ liệu từ database rồi xuất ra thì chỉnh sữa sao anh, có thể hướng dẫn em được ko ah, em gà code lắm

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s