Python Bleach

Catalogue
  1. 1. HTML标签过滤

HTML标签过滤

import bleach


class XSS_defender:

@classmethod
def clean(cls, content):
tags = ['table', 'tbody', 'thead', 'tfoot', 'tr', 'th', 'td',
'ul', 'ol', 'li',
'h1', 'h2', 'h3', 'h4', 'h5', 'h6',
'p', 'span', 'strong', 'img',
'br', 'div', 'caption',
'b', 'blockquote', 'cite', 'code', 'col', 'colgroup',
'dd', 'dl', 'dt', 'em', 'i',
'pre', 'q', 'small', 'strike', 'sub', 'sup',
'u', 'article', 'section', 'aside',
'header', 'footer', 'address', 'small', 'main', 'nav']
attr = ['title', 'alt', 'src', 'href', 'class', 'style', 'span', 'width', 'align',
'height', 'start', 'type', 'cite', 'summary', 'abbr', 'axis', 'colspan', 'rowspan', 'scope']
return bleach.clean(content, tags=tags, attributes=attr)