2008-10-06 45 views
11

Tôi đang tìm một trang web html tĩnh và di chuyển nội dung đó sang CMS được cơ sở dữ liệu hỗ trợ. Tôi muốn sử dụng Dệt may trong CMS.Làm cách nào để chuyển đổi HTML sang Dệt may?

Có công cụ nào chuyển đổi HTML thành Dệt may, vì vậy tôi có thể loại bỏ trang web hiện tại, chuyển đổi HTML thành Dệt và chèn dữ liệu đó vào cơ sở dữ liệu không?

Trả lời

-2

Đây là một thay thế đánh dấu đơn giản, không có gì mà một regex tốt không thể khắc phục được.

Tôi khuyên bạn nên Perl, LWP :: Đơn giản và một số regexes để làm toàn bộ điều (bò loang, tước thiết kế và các menu, chuyển sang dệt, và sau đó gửi bài đến cơ sở dữ liệu.)

1

Tôi biết đây là một câu hỏi cũ, nhưng tôi thấy mình đang cố gắng làm điều này vào ngày khác và không tìm thấy bất cứ điều gì hữu ích, cho đến khi tôi tìm thấy Pandoc. Nó cũng có thể chuyển đổi nhiều định dạng đánh dấu khác - nó khá rực rỡ.

+0

Nhưng bạn sẽ mất phong cách và những thứ khác. Sau đó, bạn cũng có thể chuyển đổi thành Đánh dấu. – Bruno

-1

thử mã java đơn giản này hy vọng nó làm việc cho bạn

import java.net.*; 
import java.io.*; 

class Crawle 
{ 

public static void main(String ar[])throws Exception 
{ 


URL url = new URL("https://www.google.co.in/#q=i+am+happy"); 
InputStream io = url.openStream(); 
BufferedReader br = new BufferedReader(new InputStreamReader(io)); 
FileOutputStream fio = new FileOutputStream("crawler/file.txt"); 
PrintWriter pr = new PrintWriter(fio,true); 
String data = ""; 
while((data=br.readLine())!=null) 
{ 
pr.println(data); 
System.out.println(data); 
} 

} 
} 
} 
+0

Không liên quan gì đến Dệt may – cmroanirgo

+0

Theo câu hỏi anh ta muốn thu thập bất kỳ trang nào và sau đó cần phải lưu vào bất kỳ tệp văn bản nào, vì vậy những gì tôi đăng trong câu trả lời của tôi chỉ liên quan đến điều đó. Và trong câu trả lời của tôi, tôi đã chia sẻ ví dụ đơn giản cho truy vấn trên. Tôi vẫn không nhận được lý do từ chối. – Simmant

+0

tệp văn bản <> văn bản. xem http://redcloth.org/textile – cmroanirgo

0

Vì không có thực hiện javascript, tôi đã viết một: https://github.com/cmroanirgo/to-textile

Đó là một chút nguyên thủy vào lúc này, vì nó là một người mù cổng của 'to-markdown' tương đương, nhưng sẽ hoàn thành công việc.

Các vấn đề liên quan