PDF සිට Excel වෙත Power Query හරහා දත්ත ආයාත කරන්න

මයික්‍රොසොෆ්ට් එක්සෙල් පත්‍රයකට PDF ගොනුවක පැතුරුම්පතකින් දත්ත මාරු කිරීමේ කාර්යය සැමවිටම "විනෝදජනක" වේ. විශේෂයෙන්ම ඔබට FineReader වැනි මිල අධික හඳුනාගැනීමේ මෘදුකාංගයක් හෝ එවැනි දෙයක් නොමැති නම්. සෘජු පිටපත් කිරීම සාමාන්‍යයෙන් යහපත් දෙයකට මඟ පාදන්නේ නැත, මන්ද. පිටපත් කළ දත්ත පත්‍රයේ ඇලවීමෙන් පසු, ඒවා බොහෝ විට එක් තීරුවකට “එකට ඇලී” යනු ඇත. එබැවින් මෙවලමක් භාවිතයෙන් ඔවුන් වෙහෙස මහන්සි වී වෙන් කිරීමට සිදුවනු ඇත තීරු අනුව පෙළ ටැබ් එකෙන් දත්ත (දත්ත — පෙළ සිට තීරු දක්වා).

ඇත්ත වශයෙන්ම, පිටපත් කිරීම කළ හැක්කේ පෙළ ස්ථරයක් ඇති එම PDF ගොනු සඳහා පමණි, එනම් කඩදාසි සිට PDF වෙත ස්කෑන් කර ඇති ලේඛනයක් සමඟ, මෙය ප්‍රතිපත්තිමය වශයෙන් ක්‍රියා නොකරනු ඇත.

ඒත් ඒක එච්චර දුකක් නෙවෙයි ඇත්තටම 🙂

ඔබට Office 2013 හෝ 2016 තිබේ නම්, අමතර වැඩසටහන් නොමැතිව මිනිත්තු කිහිපයකින්, PDF සිට Microsoft Excel වෙත දත්ත මාරු කළ හැකිය. ඒ වගේම Word සහ Power Query අපිට මේ සඳහා උදවු වේවි.

උදාහරණයක් ලෙස, යුරෝපය සඳහා වන ආර්ථික කොමිසමේ වෙබ් අඩවියෙන් පෙළ, සූත්‍ර සහ වගු පොකුරක් සමඟින් මෙම PDF වාර්තාව ගනිමු:

PDF සිට Excel වෙත Power Query හරහා දත්ත ආයාත කරන්න

… සහ Excel හි එය ඉවත් කිරීමට උත්සාහ කරන්න, පළමු වගුව කියන්න:

PDF සිට Excel වෙත Power Query හරහා දත්ත ආයාත කරන්න

අපි යමු!

පියවර 1. Word හි PDF විවෘත කරන්න

කිසියම් හේතුවක් නිසා, ස්වල්ප දෙනෙක් දනිති, නමුත් 2013 සිට මයික්‍රොසොෆ්ට් වර්ඩ් PDF ගොනු විවෘත කිරීමට සහ හඳුනා ගැනීමට ඉගෙන ගෙන ඇත (ස්කෑන් කළ ඒවා පවා, එනම් පෙළ ස්තරයක් නොමැතිව!). මෙය සම්පූර්ණයෙන්ම සම්මත ආකාරයෙන් සිදු කෙරේ: විවෘත වචනය, ක්ලික් කරන්න ගොනුව - විවෘත කරන්න (ගොනුව - විවෘත) සහ කවුළුවේ පහළ දකුණු කෙළවරේ පතන ලැයිස්තුවේ PDF ආකෘතිය සඳහන් කරන්න.

ඉන්පසු අපට අවශ්‍ය PDF ගොනුව තෝරා ක්ලික් කරන්න විවෘත (විවෘත). වර්ඩ් අපට පවසන්නේ එය OCR මෙම ලේඛනයේ පෙළට ධාවනය කිරීමට යන බවයි:

PDF සිට Excel වෙත Power Query හරහා දත්ත ආයාත කරන්න

අපි එකඟ වන අතර තත්පර කිහිපයකින් වර්ඩ් හි දැනටමත් සංස්කරණය කිරීම සඳහා අපගේ PDF විවෘත වනු ඇත:

PDF සිට Excel වෙත Power Query හරහා දත්ත ආයාත කරන්න

ඇත්ත වශයෙන්ම, නිර්මාණය, මෝස්තර, අකුරු, ශීර්ෂක සහ පාදක, ආදිය ලේඛනයෙන් අර්ධ වශයෙන් පියාසර කරනු ඇත, නමුත් මෙය අපට වැදගත් නොවේ - අපට අවශ්‍ය වන්නේ වගු වලින් දත්ත පමණි. ප්‍රතිපත්තිමය වශයෙන්, මෙම අවස්ථාවෙහිදී, පිළිගත් ලේඛනයෙන් වගුව සරලව Word වෙත පිටපත් කර එය Excel වෙත ඇලවීමට දැනටමත් පෙළඹී ඇත. සමහර විට එය ක්‍රියා කරයි, නමුත් බොහෝ විට එය සියලු ආකාරයේ දත්ත විකෘති කිරීම් වලට තුඩු දෙයි - නිදසුනක් ලෙස, සංඛ්‍යා දින බවට හැරවිය හැකිය, නැතහොත් අපගේ නඩුවේදී මෙන් පෙළ ලෙස පැවතිය හැකිය. PDF-විභේදක භාවිතා කරයි:

PDF සිට Excel වෙත Power Query හරහා දත්ත ආයාත කරන්න

ඒ නිසා අපි කොන කපන්න එපා, නමුත් හැම දෙයක්ම ටිකක් සංකීර්ණ කරන්න, නමුත් හරි.

පියවර 2: ලේඛනය වෙබ් පිටුවක් ලෙස සුරකින්න

ලැබුණු දත්ත එක්සෙල් වෙත පැටවීමට (පවර් විමසුම හරහා), අපගේ වර්ඩ් ලේඛනය වෙබ් පිටු ආකෘතියෙන් සුරැකිය යුතුය - මෙම ආකෘතිය, මේ අවස්ථාවේ දී, වර්ඩ් සහ එක්සෙල් අතර පොදු හරයකි.

මෙය සිදු කිරීම සඳහා, මෙනුව වෙත යන්න ගොනුව - ලෙස සුරකින්න (ගොනුව - ලෙස සුරකින්න) හෝ යතුර ඔබන්න F12 යතුරුපුවරුවේ සහ විවෘත වන කවුළුවෙහි, ගොනු වර්ගය තෝරන්න එක් ගොනුවක වෙබ් පිටුව (වෙබ් පිටුව - තනි ගොනුව):

PDF සිට Excel වෙත Power Query හරහා දත්ත ආයාත කරන්න

සුරැකීමෙන් පසු, ඔබ mhtml දිගුව සහිත ගොනුවක් ලබා ගත යුතුය (ඔබ එක්ස්ප්ලෝරර් හි ගොනු දිගු දුටුවහොත්).

අදියර 3. බල විමසුම හරහා ගොනුව Excel වෙත උඩුගත කිරීම

ඔබට එක්සෙල් හි සාදන ලද MHTML ගොනුව කෙලින්ම විවෘත කළ හැකිය, නමුත් පසුව අපට, පළමුව, PDF හි සියලුම අන්තර්ගතයන්, පෙළ සහ අනවශ්‍ය වගු පොකුරක් සමඟ එකවර ලැබෙනු ඇති අතර, දෙවනුව, වැරදි නිසා අපට නැවත දත්ත අහිමි වනු ඇත. බෙදුම්කරුවන්. එබැවින්, අපි Excel වෙත ආයාත කිරීම Power Query add-in හරහා සිදු කරන්නෙමු. මෙය සම්පූර්ණයෙන්ම නොමිලේ ඇඩෝනයක් වන අතර ඔබට ඕනෑම ප්‍රභවයකින් (ගොනු, ෆෝල්ඩර, දත්ත සමුදායන්, ඊආර්පී පද්ධති) පාහේ එක්සෙල් වෙත දත්ත උඩුගත කළ හැකි අතර පසුව ලැබුණු දත්ත හැකි සෑම ආකාරයකින්ම පරිවර්තනය කර එයට අවශ්‍ය හැඩය ලබා දෙයි.

ඔබට Excel 2010-2013 තිබේ නම්, ඔබට නිල Microsoft වෙබ් අඩවියෙන් Power Query බාගත කළ හැක - ස්ථාපනය කිරීමෙන් පසු ඔබට ටැබ් එකක් පෙනෙනු ඇත. බල විමසුම. ඔබ සතුව Excel 2016 හෝ ඊට වඩා අලුත් නම්, ඔබට කිසිවක් බාගත කිරීමට අවශ්‍ය නැත - සියලුම ක්‍රියාකාරීත්වය දැනටමත් Excel වෙත පෙරනිමියෙන් ගොඩනගා ඇති අතර ටැබය මත පිහිටා ඇත. දත්ත (දිනය) කණ්ඩායම තුළ බාගත කර පරිවර්තනය කරන්න (ලබා ගෙන පරිවර්තනය කරන්න).

ඉතින් අපි එක්කෝ ටැබ් එකට යනවා දත්ත, හෝ ටැබ් එක මත බල විමසුම සහ කණ්ඩායමක් තෝරන්න දත්ත ලබා ගැනීමට or විමසුම සාදන්න - ගොනුවෙන් - XML ​​වෙතින්. XML ගොනු පමණක් නොව දෘශ්‍යමාන කිරීමට, කවුළුවේ පහළ දකුණු කෙළවරේ පතන ලැයිස්තුවේ පෙරහන් වෙනස් කරන්න සියලුම ලිපිගොනු (සියලු ගොනු) සහ අපගේ MHTML ගොනුව සඳහන් කරන්න:

PDF සිට Excel වෙත Power Query හරහා දත්ත ආයාත කරන්න

ආනයනය සාර්ථකව නිම නොවන බව කරුණාවෙන් සලකන්න, මන්ද. Power Query අපෙන් XML අපේක්ෂා කරයි, නමුත් අපට ඇත්ත වශයෙන්ම HTML ආකෘතියක් ඇත. එබැවින්, දිස්වන ඊළඟ කවුළුවෙහි, ඔබට බල විමසුමට තේරුම්ගත නොහැකි ගොනුව මත දකුණු-ක්ලික් කර එහි ආකෘතිය සඳහන් කිරීමට අවශ්‍ය වනු ඇත:

PDF සිට Excel වෙත Power Query හරහා දත්ත ආයාත කරන්න

ඊට පසු, ගොනුව නිවැරදිව හඳුනා ගන්නා අතර එහි අඩංගු සියලුම වගු ලැයිස්තුවක් අපට පෙනෙනු ඇත:

PDF සිට Excel වෙත Power Query හරහා දත්ත ආයාත කරන්න

දත්ත තීරුවේ ඇති සෛලවල සුදු පසුබිමේ (වචන වගුවේ නොවේ!) වම් මූසික බොත්තම ක්ලික් කිරීමෙන් ඔබට වගු වල අන්තර්ගතය නැරඹිය හැකිය.

අපේක්ෂිත වගුව අර්ථ දක්වා ඇති විට, හරිත වචනය මත ක්ලික් කරන්න වගුව - සහ ඔබ එහි අන්තර්ගතයට "වැටේ":

PDF සිට Excel වෙත Power Query හරහා දත්ත ආයාත කරන්න

එහි අන්තර්ගතය "පනාව" කිරීමට සරල පියවර කිහිපයක් කිරීමට ඉතිරිව ඇත, එනම්:

  1. අනවශ්‍ය තීරු මකන්න (තීරු ශීර්ෂය මත දකුණු-ක්ලික් කරන්න - ඉවත් කරන්න)
  2. තිත් කොමා වලින් ප්‍රතිස්ථාපනය කරන්න (තීරු තෝරන්න, දකුණු-ක්ලික් කරන්න - අගයන් ප්රතිස්ථාපනය කිරීම)
  3. ශීර්ෂයේ සමාන සලකුණු ඉවත් කරන්න (තීරු තෝරන්න, දකුණු-ක්ලික් කරන්න - අගයන් ප්රතිස්ථාපනය කිරීම)
  4. ඉහළ පේළිය ඉවත් කරන්න (මුල් පිටුව - රේඛා මකන්න - ඉහළ රේඛා මකන්න)
  5. හිස් රේඛා ඉවත් කරන්න (මුල් පිටුව - රේඛා මකන්න - හිස් රේඛා මකන්න)
  6. පළමු පේළිය වගු ශීර්ෂයට ඔසවන්න (මුල් පිටුව - ශීර්ෂයන් ලෙස පළමු පේළිය භාවිතා කරන්න)
  7. පෙරහන භාවිතයෙන් අනවශ්‍ය දත්ත පෙරීම

මේසය එහි සාමාන්ය ආකෘතියට ගෙන එන විට, එය විධානය සමඟ පත්රය මතට බා ගත හැක වසා බාගත කරන්න (වසන්න සහ පූරණය කරන්න) on ප්රධාන ටැබ්. අපට දැනටමත් වැඩ කළ හැකි එවැනි අලංකාරයක් අපට ලැබෙනු ඇත:

PDF සිට Excel වෙත Power Query හරහා දත්ත ආයාත කරන්න

  • බල විමසුම සහිත තීරුවක් වගුවකට පරිවර්තනය කිරීම
  • ඇලෙන සුළු පෙළ තීරුවලට බෙදීම

ඔබමයි