2012-08-28 57 views
1

我是oracle新手。我想要一个巨大的示例数据库(有百万个元组)。我找不到任何使用谷歌。 我使用oracle 10g .. 你们知道我可以从哪里下载?示例数据库

谢谢。

回答

1

我不知道该尺寸的任何“现成”的示例数据库的

据我所看到的,你有两个选择:

  1. 使用PolePosition创建示例数据库。它最初是一个基准框架,但带有它自己的数据库模式和必要的工具生成大型数据库(您可以定义哪个大小)
  2. 使用像Benerator这样的测试数据生成器可以从头开始完全创建测试数据。起初它似乎有点吓人,但它是一个非常强大的工具。它还有生成器来创建有意义的名称,邮政编码等。因此,您将获得“看起来”真实且不含乱码的测试数据。

以下benerator脚本表items并为每个行items产生一百万行才产生item_details 10行(这样你就拉闸100万个10万行)

<?xml version="1.0" encoding="iso-8859-1"?> 
<setup xmlns="http://databene.org/benerator/0.7.0" 
     xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
     xsi:schemaLocation="http://databene.org/benerator/0.7.0 http://databene.org/benerator-0.7.0.xsd"> 

    <import defaults="true"/> 
    <import platforms="csv"/> 


    <generate type="items" count="1000000"> 
     <consumer class="org.databene.platform.csv.CSVEntityExporter"> 
      <property name="uri" value="items.csv"/> 
      <property name="separator" value="|"/> 
      <property name="encoding" value="ISO-8859-1"/> 
     </consumer> 

     <id name="item_id" type="big_integer" generator="IncrementalIdGenerator"/> 
     <attribute name="item_name" type="string" pattern="[A-Z][a-z ]{6,25}"/> 

     <generate type="item_details" count="10"> 
      <consumer class="org.databene.platform.csv.CSVEntityExporter"> 
       <property name="uri" value="item_details.csv"/> 
       <property name="separator" value="|"/> 
       <property name="encoding" value="ISO-8859-1"/> 
      </consumer> 
      <id name="item_detail_id" type="big_integer" generator="IncrementalIdGenerator"/> 
      <attribute name="item_id" script="items.item_id"/> 
      <attribute name="sort_sequence" type="int" /> 
     </generate> 

    </generate> 
</setup> 

如果您想要更“真实”的名称,请查看以下脚本,该脚本可生成具有有效EAN代码和一些“正常”外观制造商名称的产品:

<?xml version="1.0" encoding="iso-8859-1"?> 
<setup xmlns="http://databene.org/benerator/0.7.0" 
     xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
     xsi:schemaLocation="http://databene.org/benerator/0.7.0 http://databene.org/benerator-0.7.0.xsd"> 

    <import platforms="csv"/> 
    <import domains="product"/> 
    <import domains="organization" /> 

    <setting name="product_count" value="100000"/> 

    <generate type="product" count="{product_count}"> 
     <consumer class="CSVEntityExporter"> 
      <property name="uri" value="products.csv" /> 
      <property name="separator" value=","/> 
     </consumer> 

     <id name="id" type="long"/> 
     <attribute name="ean_code" unique="true" generator="EANGenerator"/> 
     <attribute name="product_code" unique="true" pattern="[A-Z]{3}[0-9]{6}"/> 
     <variable name="cust" generator="CompanyNameGenerator" dataset="DE" locale="de_DE"/> 
     <attribute name="manufacturer_name" source="cust.shortName"/> 
    </generate> 

</setup> 

创建数据文件后,可以使用SQL * Loader将它们导入到数据库中。

这种方法的优点是,您可以完全控制测试数据库中的表格,并且可以将它们定制为您尝试使用它的任何内容。

+0

谢谢你,先生:) 对不起,我的问题不是很清楚..我只是想了解索引..我写了一个SQL程序最后做这个工作:) 再次感谢:) –