본문 바로가기
개발언어/C#

[C#] 한글 ActiveX 한글문서로 부터 Text, Html추출

by 창용이랑 2022. 9. 16.
728x90

 

string filePath = @"c:\sample.hwp"   //샘플 한글파일의 경로
HwpCtrl1.Open(filePath);

textBox.text = HwpCtrl1.GetTextFile("TEXT","").ToString();  
// 작업환경은 윈폼이고, 폼에 textBox가 올려져 있다고 가정한 코드이다.
// 한글 파일로부터 TEXT 추출시 HTML로 추출을 원하면 해당 값을 HTML로 입력하면 된다.

참 쉽죠잉~~~!!



삽질하다 알게된 다른 방법이 있다.

string filePath = @"c:\sample.hwp"   //샘플 한글파일의 경로
HwpCtrl1.Open(filePath);

// 여기까지는 동일하다.

HwpCtrl1.InitScan();   // 문서 검색을 위한 초기화
while(GetText() != 1)
{
}
HwpCtrl1.ReleaseScan();   //InitScan()으로 설정된 정보를 초기화 한다.


private int GetText()
{
    int ret = 0;

    HWPCONTROLLib.HwpParameterSet TextSet; 
    TextSet = (HWPCONTROLLib.HwpParameterSet)HwpCtrl1.CreateSet("GetText");
    ret = HwpCtrl1.GetTextBySet(TextSet);
    var txt = TextSet.Item("Text");

    textBox1.Text += txt;
    return ret;
}

 

출처 : https://naloblog.tistory.com/148