본문 바로가기

ETL Tools/Oracle Data Integrator

파일 데이터 서버 생성하기


 

파일 데이터 서버 일련의 파일 폴더 (Physical Schema 대응하는 파일 폴더) 대한 컨테이너입니다.

Topology에서 디폴트로서 제공된 FILE_GENERIC 데이터 서버는 대부분의 요구조건을 만족합니다. 대부분의 경우에 파일 데이터 서버를 생성할 필요는 없으며, 파일에 대한 Physical Schema 생성 필요하게 됩니다.

선결조건

JDBC 드라이버

성능면에서는 플랫 파일을 처리할 데이터베이스 유틸리티를 사용하는 것이 항상 좋은 선택입니다. Sunopsis 이들 유틸리티를 이용한 Knowledge Module 포함합니다. 그러나, 사용자의 요구에 맞게 Sunopsis 플랫 파일에 대해 Type 4 JDBC 드라이버를 제공합니다. 드라이버는 ASCII EBCDIC (Legacy) 파일 포맷 모두를 지원합니다.

또한 ODBC 통해 플랫 파일로 연결할 수도 있습니다. 방식은 성능이 떨어지고, 일부 다른 기능과 더불어 리버스 엔지니어링을 지원하지 않습니다. 그러므로 이것은 권장하지 않습니다.

플랫 파일용 Sunopsis JDBC 드라이버

드라이버는 제품에 내장되며, Sunopsis 함께 무료로 제공됩니다. 이것은 Sunopsis 설치 시에 설치되며, 다른 추가 구성은 필요하지 않습니다.

데이터베이스 유틸리티

대부분의 데이터베이스는 플랫 파일과 상호작용하기 위해 자체 유틸리티를 가집니다. 모든 데이터베이스는 데이터베이스 클라이언트 소프트웨어가 Agent 또는 Sunopsis 설치 디렉토리로부터 액세스할 있어야 한다는 것을 요구합니다. 일부 예는 다음과 같습니다.

  • Oracle: SQL*Loader
  • Sybase: bcp
  • Microsoft SQL Server: bcp
  • Teradata: fastload multiload

모든 유틸리티는 Sunopsis로부터 직접 사용될 있습니다. 이들 유틸리티의 올바른 설치에 관한 정보가 필요한 경우, 데이터베이스 문서를 참조하십시오.

데이터 서버 생성하기

파일 데이터 서버를 생성하려면,

1.       Topology Manager 연결하십시오.

2.       트리에서 Topology > Physical Architecture > Technologies > File 선택하십시오.

3.       오른쪽 마우스 버튼을 클릭하고, 데이터 서버 삽입 선택하십시오.

4.       정의 탭에서 다음 필드를 작성하십시오.

  • 이름: Sunopsis에서 나타나는 것과 같은 데이터 서버의 이름.
  • 사용자/비밀번호: 사용 안됨.

5.       사용된 드라이버에 따라 JDBC 탭에서 다음 필드를 작성하십시오.

  • JDBC Driver: com.sunopsis.jdbc.driver.file.FileDriver
  • JDBC URL: jdbc:snps:dbfile

6.       시험 클릭하십시오.

7.       연결 시험 창에서 시험 클릭하십시오.

8.       연결 성공 나타내는 창이 나타나야 합니다. 확인 클릭하십시오.

9.       데이터 서버의 생성을 승인하려면 확인 클릭하십시오.

데이터 서버에 대한 첫번째 Physical Schema 대한 생성 창이 나타납니다.
파일에 대한 Physical Schema 생성하기 참조하십시오.

파일에 대한 Physical Schema 생성하기

Sunopsis Physical Schema 다음과 같은 쌍의 디렉토리에 대응합니다.

·         Sunopsis 인터페이스에 대한 원본 대상 파일을 찾게 (데이터) Schema.

·         Sunopsis 데이터 라이브러리에 포함된 원본 대상에 결합된 임시 파일을 조정하기 위해 결국 생성할 Work Schema.

: 데이터 Work Schema 각각 디렉토리를 설명합니다. 디렉토리는 변환을 실행하기 위해 사용될 Agent 액세스할 있어야 합니다. 디렉토리는 절대 경로 (m:/public/data/files) 또는 Agent 시작 디렉토리에 상대적인 경로 (../demo/files) 있습니다. 경로에 대해 UNC (실행 위치로부터 독립적임) 사용할 것을 강력히 권장합니다.
"Agent
없음" 이용하여 변환을 실행할 , 디렉토리는 Sunopsis 설치되어 있는 디렉토리에 상대적입니다.

: 특히 Unix에서, Agent (읽기 전용 파일에 액세스하기 위해서라도) 이들 디렉토리에 관한 읽기/쓰기 권한을 가져야 하며, 이에 따라 Agent 유효하지 않은 파일 기록에 대한 오류 파일을 생성할 것입니다.

: 파일 경로는 Windows Unix에서 각각 다르다는 것을 명심하십시오. 정보를 설정할 Agent 의해 사용된 플랫폼을 고려하십시오.

Physical Schema 생성

파일 Physical Schema 생서하려면,

: 데이터 서버를 방금 생성한 경우, 단계 1 무시하십시오. Physical Schema 창이 이미 열려있어야 합니다.

1.       Topology에서, Physical Schema 생성하고자 하는 파일 데이터 서버 선택하고, 오른쪽 마우스 버튼을 클릭하고, Physical Schema 삽입 선택하십시오. Physical Schema 창이 나타날 것입니다.

2.       디렉토리 (Schema) 원본 또는 대상 파일을 포함하는 디렉토리로의 경로를 입력하십시오.

3.       디렉토리 (Work Schema) Sunopsis Physical Schema 대한 작업 디렉토리를 입력하십시오.

4.       Schema 데이터 서버에 대한 기본 Schema 하고자 하는 경우, 디폴트 박스를 체크하십시오  (첫번째 Physical Schema 항상 기본 Physical Schema입니다). 추가 정보가 필요한 경우, Physical Schema 참조하십시오.

5.       Context 탭으로 가십시오.

6.       새로운 Physical Schema 대해 Context 기존의 Logical Schema 선택한 , 단계 8 가십시오.
파일 Logical Schema 아직 존재하지 않는 경우, 단계 7 가십시오.

7.        버튼을 클릭하십시오.

8.       왼쪽 열에서 기존의 Context 선택하고, 오른쪽 열에 Logical Schema] 이름을 입력하십시오. 파일 Logical Schema 자동적으로 생성되고, Context 있는 Physical Schema 연결됩니다.

경고 ! Logical Schema 주어진 Context에서 하나의 Physical Schema와만 연결될 있습니다.

9.       확인 클릭하십시오.

파일 모델 생성 리버스 엔지니어링

파일 모델 생성

파일 모델 디렉토리에 저장된 파일에 대응하는 일련의 Datastore입니다. 모델은 항상 Logical Schema 기반을 둡니다. 주어진 Context에서, Logical Schema 하나의 Physical Schema 대응합니다. Physical Schema Data Schema 모델에서 설명된 (결국에는 하위 디렉토리에 있는) 모든 파일을 포함하는 디렉토리입니다.

파일 모델을 생성하려면,

1.       Designer 연결하십시오.

2.       트리에서 모델 선택하십시오.

3.       오른쪽 마우스 버튼을 클릭한 , 모델 삽입 선택하십시오.

4.       정의 탭에서, 이름 필드를 입력하십시오.

5.       기술 필드에서, 파일 선택하십시오.

6.       Logical Schema 필드에서, 모델이 기반을 Logical Schema 선택하십시오.

7.       리버스 탭으로 가서, 모델의 리버스 엔지니어링에 사용될 Context 선택하십시오. 적용 클릭하십시오.

모델이 생성되지만, 아직 Datastore 포함하지 않습니다.

파일 모델 리버스 엔지니어링

모델이 Datastore 없이 생성됩니다. 리버스 엔지니어링 작업은 모델의 Datastore 정의를 생성하기 위해 모델에서 파일의 구조를 모으는 것을 말합니다.

리버스 엔지니어링에는 가지 유형이 있습니다.

·         구분 파일에 대해서만 이용할 있는 표준 리버스 엔지니어링. 이것은 파일마다 수행됩니다.

·         Microsoft Excel 스프레드시트로부터 모델의 모든 파일의 구조를 얻기 위해 RKM 사용하는 사용자 지정 리버스 엔지니어링.

·         파일을 설명하는 Copybook 제공된 경우에 고정 파일에 대해 이용할 있는 Copy-Cobol 리버스 엔지니어링. 추가 정보가 필요한 경우, Cobol Copybook 리버스 참조하십시오.

: 특정 RKM (RKM File From Excel) 파일 사용자 지정 리버스 엔지니어링에 대해 제공됩니다. RKM 여기에서 사용할 있기 위해 적어도 하나의 프로젝트로 가져야져야 합니다.

표준 리버스 엔지니어링

파일 (구분 파일만 해당) 대한 표준 리버스 엔지니어링을 수행하려면,

1.       파일 모델 오른쪽 마우스 버튼으로 클릭하고, Datastore 삽입 선택하십시오.

2.       정의 탭에서, 다음 필드를 입력하십시오.

  • 이름: Datastore 이름
  • 리소스 이름: 하위 디렉토리 (필요한 경우만) 파일의 이름 (...) 버튼을 이용하여 파일 이름을 검색할 있습니다.

3.       파일 유형을 설명하기 위해 파일 탭으로 가십시오.

  • 서식은 구분되어야 합니다.
  • 헤더 대한 라인 수를 지정하십시오. 헤더가 있는 경우, 헤더의 첫번째 라인은 파일에 있는 열을 명명하기 위해 Sunopsis 의해 사용될 것입니다.)
  • 기록 구분기호 선택하십시오.
  • 필드 구분기호로서 사용된 문자를 선택 또는 입력하십시오.
  • 파일이 텍스트 구분기호를 사용하는 경우, 텍스트 구분기호 입력하십시오.
  • 파일이 소수점을 갖는 경우, 소수 구분기호 입력하십시오.

4.       파일 정의를 저장하기 위해 적용 클릭하십시오.

5.       파일 구조를 리버스 엔지니어링하기 위해 탭으로 가십시오.

  • 리버스 버튼을 클릭하십시오.
  • 리버스 엔지니어링된 열에 대한 서식 길이를 확인하십시오. Sunopsis 유형 길이를 추정하려고 시도할 것이지만, 일부 기본 (문자열에 대해서는 보통 50) 사용할 수도 있습니다.
  • 설명을 저장하려면 적용 또는 확인 클릭하십시오.
사용자 지정 리버스 엔지니어링

리버스 엔지니어링 프로시져의 경우, Microsoft Excel 스프레드시트는 파일 그룹의 설명을 포함합니다. 예로서, Sunopsis /demo/excel 하위 디렉토리에서 발견된 file_repository.xls 파일을 편집하십시오. 다음 단계는 플랫 파일의 구조에 관한 설명을 이용하여 파일을 수정한 것으로 가정합니다.

사용자 지정 리버스 엔지니어링을 수행하려면, 다음 단계를 수행해야 합니다.

1.       파일 설명을 포함하는 Excel 스프레드시트에 대응하는 ODBC Microsoft Excel Datasource 추가하십시오.

2.       스프레드시트에 대한 데이터 서버, 물리적 Logical Schema 정의하십시오.

3.       RKM File From Excel RKM 이용해서 사용자 지정 리버스 엔지니어링을 실행하십시오.

ODBC Microsoft Excel datasource Driver (*.xls) 추가하려면,

1.       Microsoft ODBC Administrator 실행하십시오.

2.       System Datasource 추가하십시오.

3.       Microsoft Excel Driver (*.xls) 선택하십시오.

4.       데이터 원본 SUNOPSIS_XL_FILE_REPO 명명하고, /demo/excel/file_repository.xls 파일을 선택하십시오.

Microsoft Excel 스프레드시트에 대한 데이터 서버, 물리적 Logical Schema 정의하려면,

1.       Topology Manager 모듈을 실행하십시오.

2.       다음 매개변수와 함께 Microsoft Excel 데이터 서버 추가하십시오.

Name: EXCEL_FILE_REPOSITORY

JDBC Driver: sun.jdbc.odbc.JdbcOdbcDriver

JDBC URL: jdbc:odbc:SUNOPSIS_XL_FILE_REPO

 

3.       수정한 것을 적용하십시오.

4.       기본 Physical Schema 관한 Logical Schema 추가하십시오.

5.       Physical Schema Context 탭에서, 클릭하십시오.

6.       새로운 라인에서, 리버스 엔지니어링에 대한 Context 선택하고, 두번째 열에 EXCEL_FILE_REPOSITORY 입력하십시오. 이름은 필수적인 것입니다.

7.       수정한 것을 적용하십시오.

사용자 지정 리버스 엔지니어링을 실행하려면,

1.       Designer 모듈을 여십시오.

2.       RKM File From Excel Knowledge Module 적어도 하나의 프로젝트로 가져오십시오.

3.       모델 파일을 클릭하고, 오른쪽 마우스 버튼을 클릭한 , 편집 선택하십시오.

4.       리버스 탭에서, 다음 매개변수를 설정하십시오.

  • Customized 선택
  • Context: Reverse Context
  • KM : RKM File from Excel

5.       리버스 클릭하십시오.

6.       실행 로그에서 리버스 엔지니어링 프로세스를 따라할 있습니다.

중요: Microsoft Excel Logical Schema 정의되어야 합니다. 이것은  EXCEL_FILE_REPOSITORY 명명되고, file_repository.xls 파일 또는 유사한 구조를 갖는 다른 파일을 가리켜야 합니다.

중요: Microsoft Excel 파일 file_repository.xls 리버스 엔지니어링을 실행하기 전에 닫혀야 합니다.

파일을 이용하는 경우의 KM 선택

검사 또는 인터페이스에 대한 KM 선택은 인터페이스 또는 검사의 기능 성능을 결정합니다. 아래 권장사항은 파일 서버와 관련한 상이한 상황에 대해 KM 선택하는데 도움을 줍니다.

KM 관한 일반적인 정보가 필요한 경우, Knowledge Module 참조하십시오.

: 프로젝트로 가져온 Knowledge Module 프로젝트의 인터페이스에 의한 이용에 대해 사용할 있습니다. KM 가져오려면, KM 가져오기 참조하십시오.

파일에서 파일로 데이터 로드

파일은 인터페이스에서 원본 또는 대상 (스테이징 영역으로서는 아님)으로서 사용될 있습니다. 인터페이스 흐름 탭에서 LKM 선택은 인터페이스의 성능을 결정하는데 필수적입니다.

파일에서 LKM 선택

다음 경우에서의 LKM 대한 권장사항,

·         스테이징 영역에 대한 파일 원본

개의 솔루션이 가능한 경우, 이들은 선호도 성능 순으로 표시됩니다. 일반 KM 굵게 표현됩니다.

대상 또는 스테이징 영역 기술

권장 KM

비고

Oracle

LKM File to Oracle (sql*loader)

일반 LKM 보다 빠름 (sql*loader 사용)

All

LKM ISO File to SQL

일반 KM

파일에서 데이터 통합

파일에 대한 IKM 선택

다음 경우에서의 LKM 대한 권장사항,

·         파일 대상에 대한 스테이징 영역

선택된 통합 모드에 따라 파일로 통합을 수행할 KM 대한 권장사항. 개의 솔루션이 가능한 경우, 이들은 선호도 성능 순으로 표시됩니다. 일반 KM 굵게 표현됩니다.

모드

대상

권장 KM

비고

Append

File

IKM ISO SQL to File Append

Flow 컨트롤 없음

: 대상 파일이 존재하는 경우에 이를 삭제하지 않고 생성하고자 하는 경우 (TRUNCATE 옵션), KM에서 다음 단계를 삽입해야 합니다.
- Technology:
File

- Command:
CREATE TABLE
- Ignore Error
선택하거나, 인터페이스 흐름 탭에서 파일 생성을 실행시킬 있는 옵션을 생성하십시오.