Cách xóa ký tự html trong chuỗi asp.net (c#)

Thảo luận trong 'Lập trình web Asp.net' bắt đầu bởi seolagi, 1/6/17.

  1. seolagi

    seolagi

    Vip Member

    Tham gia ngày:
    16/4/14
    Bài viết:
    369
    Đã được thích:
    15
    Điểm thành tích:
    18
    hi mọi người, giúp mình với. Mình có 1 đoạn text lấy auto tự động từ web khách hàng về, chuỗi này có chứa thẻ <p></p> thẻ <style> css và xml,.. rất nhiều ký tự html trong đó. GIúp mình làm sao để xóa đi mấy ký tự này với.
    Cảm ơn mọi người
     
    Cảm ơn đã xem bài:

    Cách xóa ký tự html trong chuỗi asp.net (c#)

    danh sách diễn đàn rao vặt gov chất lượng
  2. admin

    admin Phạm Công Sơn Thành viên BQT

    Tham gia ngày:
    22/5/13
    Bài viết:
    4,021
    Đã được thích:
    847
    Điểm thành tích:
    113
    Giới tính:
    Nam
    Bạn đọc bài sau để biết cách xóa nhé : http://itseovn.com/threads/xoa-toan-bo-dinh-dang-html-trong-chuoi-file-text-c-asp-net.185468.html
    Hoặc tham khảo nhanh đoạn code sau:
    Mã:
    public static string HtmlStrip(string input)
    {
        input = Regex.Replace(input, "<script>(.|\n)*?</script>", string.Empty); // xóa tất cả định dạng <script></script> nằm trong
        input = Regex.Replace(input, "<style>(.|\n)*?</style>", string.Empty); // xóa tất cả định dạng <style></style> nằm trong
        input = Regex.Replace(input, @"<xml>(.|\n)*?</xml>", string.Empty); // xóa tất cả <xml></xml> nằm trong
        return Regex.Replace(input, @"<(.|\n)*?>", string.Empty); // xóa những thẻ ví dụ như "<p>sơn<span> linh</span></p>" thành "sơn linh"
    }
     
  3. học seo

    học seo Thành Viên Mới

    Tham gia ngày:
    30/6/17
    Bài viết:
    6
    Đã được thích:
    0
    Điểm thành tích:
    1
    Giới tính:
    Nữ
    i dont care no shut me to s
     


Like và Share ủng hộ ITSEOVN